Java程序 import java.util.Arrays; import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaRDD; import org.apache.spark.api.java.JavaSpar ...
分类:
编程语言 时间:
2017-12-22 00:30:57
阅读次数:
218
目录 安装jdk 安装Scala IDE for Eclipse 配置Spark 配置Hadoop 创建Maven工程 Scala代码 条目7 条目8 条目9 安装jdk 要求安装jdk1.8或以上版本。 返回目录 安装Scala IDE for Eclipse 无需额外安装scala,这个IDE里 ...
什么是大数据 Volume —— 数据量大 随着技术的发展,人们收集信息的能力越来越强,随之获取的数据量也呈爆炸式增长。例如百度每日处理的数据量达上百PB,总的数据量规模已经到达EP级。 Velocity —— 处理速度快 指的是销售、交易、计量等等人们关心的事件发生的频率。2017年双11,支付成 ...
分类:
其他好文 时间:
2017-12-15 15:00:15
阅读次数:
106
目录 梯度提升树原理 梯度提升树代码(Spark Python) 梯度提升树原理 待续... 返回目录 梯度提升树代码(Spark Python) 代码里数据:https://pan.baidu.com/s/1jHWKG4I 密码:acq1 返回目录 ...
分类:
编程语言 时间:
2017-12-12 17:46:25
阅读次数:
228
目录 随机森林原理 随机森林代码(Spark Python) 随机森林原理 待续... 返回目录 随机森林代码(Spark Python) 代码里数据:https://pan.baidu.com/s/1jHWKG4I 密码:acq1 返回目录 ...
分类:
编程语言 时间:
2017-12-12 17:35:25
阅读次数:
208
目录 决策树原理 决策树代码(Spark Python) 决策树原理 详见博文:http://www.cnblogs.com/itmorn/p/7918797.html 返回目录 决策树代码(Spark Python) 代码里数据:https://pan.baidu.com/s/1jHWKG4I 密 ...
分类:
编程语言 时间:
2017-12-11 22:11:47
阅读次数:
845
目录 朴素贝叶斯原理 朴素贝叶斯代码(Spark Python) 朴素贝叶斯原理 详见博文:http://www.cnblogs.com/itmorn/p/7905975.html 返回目录 朴素贝叶斯代码(Spark Python) 代码里数据:https://pan.baidu.com/s/1j ...
分类:
编程语言 时间:
2017-12-11 16:45:35
阅读次数:
271
目录 Logistic回归原理 Logistic回归代码(Spark Python) Logistic回归原理 详见博文:http://www.cnblogs.com/itmorn/p/7890468.html 返回目录 Logistic回归代码(Spark Python) 代码里数据:https: ...
分类:
编程语言 时间:
2017-12-11 16:07:50
阅读次数:
215
package Spark_MLlib import java.util.Properties import org.apache.spark.mllib.regression.LabeledPoint import org.apache.spark.mllib.linalg.{Vector, Ve ...
分类:
其他好文 时间:
2017-12-09 14:03:58
阅读次数:
268
目录 支持向量机原理 支持向量机代码(Spark Python) 支持向量机原理 待续... 返回目录 支持向量机代码(Spark Python) 代码里数据:https://pan.baidu.com/s/1hsrNAxm 返回目录 ...
分类:
系统相关 时间:
2017-12-08 18:37:42
阅读次数:
275