R语言data.table速查手册 介绍 R中的data.table包提供了一个data.frame的高级版本,让你的程序做数据整型的运算速度大大的增加。data.table已经在金融,基因工程学等领域大放光彩。他尤其适合那些需要处理大型数据集(比如 1GB 到100GB)需要在内存中处理数据的人。 ...
分类:
其他好文 时间:
2016-11-17 18:35:35
阅读次数:
416
Bokeh 0.12.3dev3 发布了,Bokeh (Bokeh.js) 是一个 Python 交互式可视化库,支持现代化 Web 浏览器,提供非常完美的展示功能(腾云科技ty300.com)。Bokeh 的目标是使用 D3.js 样式提供优雅,简洁新颖的图形化风格,同时提供大型数据集的高性能交互 ...
分类:
编程语言 时间:
2016-09-14 12:41:24
阅读次数:
196
Bokeh 0.12.3dev1 和 0.12.3dev2 发布了,Bokeh (Bokeh.js) 是一个 Python 交互式可视化库,支持现代化 Web 浏览器,提供非常完美的展示功能。Bokeh 的目标是使用 D3.js 样式提供优雅,简洁新颖的图形化风格,同时提供大型数据集的高性能交互功能 ...
分类:
其他好文 时间:
2016-09-11 12:57:42
阅读次数:
159
Bokeh 0.12.2rc1 发布了,Bokeh (Bokeh.js) 是一个 Python 交互式可视化库,支持现代化 Web 浏览器,提供非常完美的展示功能(腾云科技ty300.com)。Bokeh 的目标是使用 D3.js 样式提供优雅,简洁新颖的图形化风格,同时提供大型数据集的高性能交互功 ...
分类:
编程语言 时间:
2016-09-03 14:59:03
阅读次数:
161
Bokeh 0.12.2rc1 发布了,Bokeh (Bokeh.js) 是一个 Python 交互式可视化库,支持现代化 Web 浏览器,提供非常完美的展示功能(app制作ty300.com)。Bokeh 的目标是使用 D3.js 样式提供优雅,简洁新颖的图形化风格,同时提供大型数据集的高性能交互 ...
分类:
编程语言 时间:
2016-09-03 09:47:51
阅读次数:
138
相比Java的MapReduce api,Pig为大型数据集的处理提供了更高层次的抽象,与MapReduce相比,Pig提供了更丰富的数据结构,一般都是多值和嵌套的数据结构。Pig还提供了一套更强大的数据变换操作,包括在MapReduce中被忽视的连接Join操作。 Hadoop版本:2.2.0 P ...
分类:
其他好文 时间:
2016-08-23 20:26:45
阅读次数:
131
一. 概念 关联分析用于发现隐藏在大型数据集中的有意义的联系。所发现的联系可以用关联规则(association rule)或频繁项集的形式表示。 项集:在关联分析中,包含0个或多个项的集合被称为项集(itemset)。如果一个项集包含k个项,则称它为k-项集。例如:{啤酒,尿布,牛奶,花生} 是一 ...
分类:
编程语言 时间:
2016-08-16 22:00:15
阅读次数:
2109
一、读写CSV数据: 二、数据汇总和统计:pandas(大型数据集分析、数据归组、统计分析等) ...
分类:
编程语言 时间:
2016-08-11 22:27:15
阅读次数:
248
17.1 大型数据集的学习 17.2 随机梯度下降法 17.3 微型批量梯度下降 17.4 随机梯度下降收敛 17.5 在线学习 17.6 映射化简和数据并行 17.1 大型数据集的学习 17.2 随机梯度下降法 17.3 微型批量梯度下降 17.4 随机梯度下降收敛 17.5 在线学习 17.6 ...
分类:
系统相关 时间:
2016-04-28 00:14:37
阅读次数:
301
数据挖掘(又称从数据中发现知识,KDD)例1.1 数据挖掘把大型数据集转换成知识。Google的Flu Trends(流感趋势)使用特殊的搜索项作为流感活动的指示器。它发现了搜索流感相关信息的人数与实际具有流感症状的人数之间的紧密联系。当与流感相关的所有搜索都聚集在一起时,一个模式就出现了。使用聚集...
分类:
其他好文 时间:
2016-01-17 12:15:42
阅读次数:
489