准备:1. 规划3个集群节点:hosts主机都已经配置好映射,映射主机名分别为master,slave1,slave2,且已经进行ssh免密配置,确保端口互通,防火墙关闭 2. 先安装好scala(参考:https://www.cnblogs.com/sea520/p/13518158.html) ...
分类:
其他好文 时间:
2021-06-19 19:11:31
阅读次数:
0
转自:https://blog.csdn.net/qq_25062299/article/details/95592877 ...
分类:
其他好文 时间:
2021-06-19 19:00:51
阅读次数:
0
Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素 ...
分类:
编程语言 时间:
2021-06-19 18:59:13
阅读次数:
0
Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素 ...
分类:
编程语言 时间:
2021-06-19 18:58:22
阅读次数:
0
redis学习 五大数据类型,开发必会的技能 老师的博客 https://www.cnblogs.com/pyyu/p/9467279.html string,字符串类型 hash,哈希类型,如同python的dict Set,无序集合 Zset,有序集合 List,双向队列,向左插入数据,向右插入 ...
分类:
其他好文 时间:
2021-06-19 18:53:25
阅读次数:
0
2.1 缺失值观察与处理 (1)请查看每个特征缺失值个数 df[df.Age.isna()] (2)缺失值处理方法 填充方法: 思考: ...
分类:
其他好文 时间:
2021-06-18 19:22:41
阅读次数:
0
在大数据智慧时代背景下,爬虫技术的需求愈发增多。而在最近,淘宝网的大量用户数据就遭到了泄露。6月3日,商丘市睢阳区人民法院在裁判文书网,公开了一份刑事判决书,显示两名犯罪分子在淘宝爬取并盗走大量数据。 经过检方核实,被盗取的淘宝用户数据近 12 亿条。淘宝去年 8 月 14 日报警,有黑产人员通过接 ...
分类:
其他好文 时间:
2021-06-17 17:19:00
阅读次数:
0
简介: 本文将会讲述共享充电宝开创企业来电科技如何基于 Flink + Hologres 构建统一数据服务加速的实时数仓 作者:陈健新,来电科技数据仓库开发工程师,目前专注于负责来电科技大数据平台离线和实时架构的整合。 深圳来电科技有限公司(以下简称 “来电科技”)是共享充电宝行业开创企业,主要业务 ...
分类:
其他好文 时间:
2021-06-17 17:00:49
阅读次数:
0
spark程序初始化HiveContext报错:空指针异常 版本说明: spark: 1.6.1 scala: 2.10.8 hive: 1.2.1 报错信息 java.lang.RuntimeException: java.lang.NullPointerException at org.apac ...
分类:
其他好文 时间:
2021-06-17 16:37:17
阅读次数:
0
什么是数据分析 是把隐藏在一些看似杂乱无章的数据背后的信息提炼出来,总结出所研究对象的内在规律 使得数据的价值最大化 分析用户的消费行为 制定促销活动的方案 制定促销时间和粒度 计算用户的活跃度 分析产品的回购力度 分析广告点击率 决定投放时间 制定广告定向人群方案 决定相关平台的投放 ...... ...
分类:
其他好文 时间:
2021-06-16 18:16:03
阅读次数:
0