Connect to Spark from R. The sparklyr package provides a complete dplyr backend. Filter and aggregate Spark datasets then bring them into R for analys ...
分类:
编程语言 时间:
2017-07-04 14:43:19
阅读次数:
409
#获取数据 from sklearn.datasets import load_iris iris=load_iris() data=iris.data target=iris.target #选定训练集和测试集 from sklearn.cross_validation import train_ ...
分类:
其他好文 时间:
2017-07-02 18:29:44
阅读次数:
843
SparkSQL 实战应用 数据集 :http://grouplens.org/datasets/movielens/ MovieLens 1M Datase 相关数据文件 : users.dat UserID::Gender::Age::Occupation::Zip-code movies.da ...
分类:
数据库 时间:
2017-07-02 14:23:53
阅读次数:
199
Spark算子实战应用 数据集 :http://grouplens.org/datasets/movielens/ MovieLens 1M Datase 相关数据文件 : users.dat UserID::Gender::Age::Occupation::Zip-code movies.dat ...
分类:
其他好文 时间:
2017-07-02 13:45:33
阅读次数:
180
数据结构 核心之数据集RDD 俗称为弹性分布式数据集。Resilient Distributed Datasets,意为容错的、并行的数据结构,可以让用户显式地将数据存储到磁盘和内存中,并能控制数据的分区。同时,RDD还提供了一组丰富的操作来操作这些数据。 RDD的特点 它是在集群节点上的不可变的、 ...
分类:
其他好文 时间:
2017-06-29 12:44:32
阅读次数:
251
LINQ概述 LINQ,语言集成查询(Language Integrated Query),它允许使用C#或VB代码以查询数据库相同的方式来操作不同的数据源。 LINQ体系结构 从上图可以看出,LINQ总共包括五个部分:LINQ to Objects、LINQ to DataSets、LINQ to ...
分类:
其他好文 时间:
2017-06-24 22:46:06
阅读次数:
219
SK-Learn API 全家福 最近SK-Learn用的比较多, 以后也会经常用,将Sk-Learn 所有内容整理了一下,整理思路,并可以备查。 (高清图片可以用鼠标右键在单独窗口打开,或者保存到本地) 基础公用 base sklearn.cluster sklearn.datasets Load ...
分类:
其他好文 时间:
2017-06-20 12:30:27
阅读次数:
209
Public datasets for machine learning http://homepages.inf.ed.ac.uk/rbf/IAPR/researchers/MLPAGES/mldat.htm Weka datasets http://www.cs.waikato.ac.nz/ml ...
分类:
系统相关 时间:
2017-06-18 18:15:18
阅读次数:
190
自带数据集类型如下: # 自带小型数据集# sklearn.datasets.load_<name># 在线下载数据集# sklearn.datasets.fetch_<name># 计算机生成数据集# sklearn.datasets.make_<name># svmlight/libsvm格式数 ...
在引言章节里,介绍了MovieLens 1M数据集的处理示例。书中介绍该数据集来自GroupLens Research(http://www.groupLens.org/node/73),该地址会直接跳转到https://grouplens.org/datasets/movielens/,这里面提供 ...
分类:
编程语言 时间:
2017-06-14 18:11:42
阅读次数:
807