码迷,mamicode.com
首页 >  
搜索关键字:mahout hadoop canopy 聚类 大数据    ( 26726个结果
R语言 系统聚类分析1
#聚类分析是一类将数据所研究对象进行分类的统计方法,这一类方法的共同特点是:#事先不知道类别的个数与结构 据以进行分类的数据是对象之间的相似性 或差异性数据#将这些相似(相异)性数据看成是对象之间的距离远近的一种度量 将距离近的对象#归入一类 不同类之间的对象距离较远#聚类分析根据分类对象不同分为Q...
分类:其他好文   时间:2014-05-27 02:31:43    阅读次数:304
浅谈大数据技术
忽如一夜春风来,无人不谈大数据。大数据就像前两年的云计算一样,是一个时下被炒得很火的概念。那么什么是大数据,大数据是如何定义的,大数据处理技术有哪些,大数据能给我们带来什么益处?虽然我不知道现在这些概念是如何被炒作的,但是作为一名互联网行业的从业者,作为一个大数据技术的实践者,根据自己的理解和经验发...
分类:其他好文   时间:2014-05-27 02:26:50    阅读次数:191
如何在Docker中部署DzzOffice
使用Docker一段时间之后,准备在公司内部使用Docker + Hadoop(HDFS)组件内部一个私有云,统一管理公司和产品/项目组内部的代码、文档。我选择先从文档管理开始,在底层架子搭建好之后,需要给内部人员提供一个好的“门面”,在没有这个门面之前,我们大量使用SSH+Command方式操作,...
分类:其他好文   时间:2014-05-24 03:44:10    阅读次数:1071
android标题栏(titlebar)显示进度条
在后台线程中执行各种操作(网络连接、大数据存储)的时候,我们希望让客户能看到后台有操作在进行,那么既能有效的提示用户,又不占用当前操作空间,最好的方法就是在标题栏有个进度条。[代码] [Java]代码protected void onCreate(Bundle savedInstanceState)...
分类:移动开发   时间:2014-05-24 00:54:52    阅读次数:302
编译hadoop版的hello,world
cd ~/srcmkdir classesjavac -classpath ~/hadoop-0.20.2/hadoop-0.20.2-core.jar WordCount.java -d classesjar -cvf WordCount.jar -C classes/ .hadoop jar W...
分类:其他好文   时间:2014-05-23 22:22:04    阅读次数:341
hadoop备记
Hadoop 的优势 Hadoop 是 一 个 能 够 让 用 户 轻 松 架 构 和 使 用 的 分 布 式 计 算 平 台。 用 户 可 以 轻 松 地 在Hadoop 上开发运行处理海量数据的应用程序。它主要有以下几个优点: 1.高可靠性。Hadoop 按位存储和处理数据的能力值得人们信赖。 2.高扩展性。Hadoop 是在可用的计算机集簇间分配数据完成计算任务的, 这些集簇可以方便地...
分类:其他好文   时间:2014-05-22 12:26:27    阅读次数:217
20140518 科技脉搏 -互联网的世界从来不缺资本,珍贵的是好创意
◎新媒体新闻门户自我革命的五大趋势 ◎大数据数据分析企业Acxiom 将以3.1亿美元收购LiveRamp毛利高达80%的商业模式,让Splunk成为第一家大数据处理的上市公司 ◎电商陈欧:“村儿”里出来的电商新贵从“京城荔战”谈生鲜格局阿里补贴外贸出口企业,欲构建外贸信用体系马云新开腔:阿...
分类:其他好文   时间:2014-05-19 16:47:49    阅读次数:295
DevExpress ChartControl大数据加载时有哪些性能优化方法
DevExpress ChartControl加载大数据量数据时的性能优化方法有哪些?关于图表优化,可从以下几个方面解决:1.关闭不需要的可视化的元素(如LineMarkers, Labels等): Series.View.LineMarkerOptions.Visible =false.2. 关闭...
分类:其他好文   时间:2014-05-19 14:43:57    阅读次数:281
GMM的EM算法实现
转自:http://blog.csdn.net/abcjennifer/article/details/8198352在聚类算法K-Means, K-Medoids, GMM, Spectral clustering,Ncut一文中我们给出了GMM算法的基本模型与似然函数,在EM算法原理中对EM算法...
分类:其他好文   时间:2014-05-19 14:15:47    阅读次数:384
Hadoop-2.2.0中文文档—— Common - CLI MiniCluster
目的 使用 CLI MiniCluster, 用户可以简单地只用一个命令就启动或关闭一个单一节点的Hadoop集群,不需要设置任何环境变量或管理配置文件。 CLI MiniCluster 同时启动一个 YARN/MapReduce 和 HDFS 集群。 这对那些想要快速体验一个真实的Hadoop集群或是测试依赖明显的Hadoop函数的非Java程序 的用户很有用。 Hadoop Ta...
分类:其他好文   时间:2014-05-18 18:41:39    阅读次数:319
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!