前言本篇我们将总结的算法为Microsoft时序算法的结果预测值,是上一篇文章Microsoft时序算法的一个总结,上一篇我们已经基于微软案例数据库的销售历史信息表,利用Microsoft时序算法对其结果进行了预测,并且相应形成了折线预测图和模型依赖属性,有兴趣的同学可以点击查看,但是上篇文章的能给...
分类:
数据库 时间:
2014-10-15 21:27:01
阅读次数:
356
了解hadoop,首先就需要先了解hadoop的数据流,就像了解servlet的生命周期似的。hadoop是一个分布式存储(hdfs)和分布式计算框架(mapreduce),但是hadoop也有一个很重要的特性:hadoop会将mapreduce计算移动到存储有部分数据的各台机器上。...
分类:
其他好文 时间:
2014-10-15 12:01:40
阅读次数:
199
全世界每天都有几十亿人使用计算机、平板电脑、手机和其它数字设备产生海量数据。在这个各个行业和领域都已经被数据给渗透,数据已成为非常重要的生产因素的大数据时代,对于大数据处理和大数据挖掘将意味着新一波的生产率不断增长和消费者盈余浪潮的到来。 在大数据时代下,从头至尾我们都脱离不了数据挖掘。有人把...
分类:
其他好文 时间:
2014-10-15 11:32:10
阅读次数:
248
前言本篇文章同样是继续微软系列挖掘算法总结,前几篇主要是基于状态离散值或连续值进行推测和预测,所用的算法主要是三种:Microsoft决策树分析算法、Microsoft聚类分析算法、Microsoft Naive Bayes 算法,当然后续还补充了一篇结果预测篇,所涉及的应用场景在前几篇文章中也有介...
分类:
数据库 时间:
2014-10-14 18:59:49
阅读次数:
335
当今这个大数据时代,数据就等于金钱。随着向一个基于应用的领域过渡,数据则呈现出了指数级增长。然而,百分之八十的数据是非结构化的,因此它需要一个程序和方法来从中提取有用信息,并且将其转换为可理解、可用的结构化形式。在数据挖掘过程中,有大量的工具可供使用,比如采用人工智能、机器学习,以及其他技术等来.....
分类:
其他好文 时间:
2014-10-14 13:00:28
阅读次数:
205
“兵马未动,粮草先行”,要想深入的了解hadoop,我觉得启动或停止hadoop的脚本是必须要先了解的。说到底,hadoop就是一个分布式存储和计算框架,但是这个分布式环境是如何启动,管理的呢,我就带着大家先从脚本入手吧。说实话,hadoop的启动脚本写的真好,里面考虑的地方非常周全(比如说路径中有空格,软连接等)。 hadoop的脚本分布在$HADOOP_HOME下面的bin目录下和conf...
分类:
其他好文 时间:
2014-10-14 11:48:38
阅读次数:
303
互联网的发展已经进入了一个大数据时代,这个数据有多大呢?在过去一年半到两年的时间当中,地球上产生的新的数据总量,相当于人类历史上产生的所有数据的总和!而作为挖掘和处理大数据的平台,云计算也应运而生。它们改变的不仅仅是互联网的发展模式,也会深刻地影响社会的商业模型、管理方式,乃至于我们每个人的生活.....
分类:
其他好文 时间:
2014-10-14 11:15:28
阅读次数:
157
维克托?迈尔?舍恩伯格和肯尼斯?库克耶在《大数据时代》中告诉我们大数据的4V特点,即Volume(大量)、Velocity(高速)、 Variety(多样)、Veracity(真实)。相比小数据,大数据一定是复杂的。然而,复杂性对于我们来说,绝对是一个机会而不应是一个问题。面对 大数据时代的扑面.....
分类:
其他好文 时间:
2014-10-13 14:17:19
阅读次数:
216
Hadoop的运行模式有以下三种:
独立模式(standalone或local mode):无需任何守护进程(daemon),所有程序都在单个JVM上执行。主要用在开发阶段。默认属性就是为本模式所设,所以不需要额外的配置。
伪分布式模式(pseudo-distributed model):Hadoop守护进程运行在本地机器上,模拟一个小规模的集群。
全分布模式(full distributed model):Hadoop守护进程运...
分类:
其他好文 时间:
2014-10-13 12:15:19
阅读次数:
252
大数据时代已经到来,想了解大数据么,想尽快的提升机自己对大数据的理解么,想学习大数据可视化分析的只是么,推荐的四本书籍不容错过。
分类:
其他好文 时间:
2014-10-11 13:26:35
阅读次数:
210