码迷,mamicode.com
首页 >  
搜索关键字:mapreduce 实战    ( 20951个结果
Mahout kmeans聚类
K-means算法是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一。K-means算法的基本思想是:以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。Mahout kmeans MapReduce实现的原理和上述的一致,值得注意的是,Mahout将数据存储在HDFS,用MapReduce做批量并行的计算。在做kmeans之前,需要将文本用Mahout向量化模块工具做向量化。计算过程主要分为三个步骤:初始中心选取,寻找簇中心,划分数...
分类:其他好文   时间:2014-05-26 06:00:31    阅读次数:239
《Java并发编程实战》第二章 线程安全性 读书笔记
一、什么是线程安全性 编写线程安全的代码 核心在于要对状态访问操作进行管理。 共享,可变的状态的访问 - 前者表示多个线程访问, 后者声明周期内发生改变. 线程安全性 核心概念是正确性。某个类的行为与其规范完全一致。 多个线程同时操作共享的变量,造成线程安全性问题。 * 编写线程安全性代码的三种方法: 不在线程之间共享该状态变量 将状态变量修改为不可变的变量 在访问...
分类:编程语言   时间:2014-05-26 05:31:40    阅读次数:282
hadoop学习;block数据块;mapreduce实现例子;UnsupportedClassVersionError异常;关联项目源码
对于开源的东东,尤其是刚出来不久,我觉得最好的学习方式就是可以看源码和doc,测试它的例子 为了方便查看源码,关联导入源码的项目 block数据块,在配置文件hdfs-default.xml中可以查看到,记住要修改不是在这里 block文件存储块是最基本的单位 查看block存放位置,配置文件中查看 如果文件大于64M会占两个块,meta文件是校验...
分类:其他好文   时间:2014-05-26 05:30:58    阅读次数:227
C++编写nodejs扩展实战
C++编写nodejs扩展实战 之前有用PHP写过根据IP地址查询IP归属地,后来改用C语言编写,效率果然大幅度提高,然后转化为PHP的扩展. 想起之前有过使用手机号码查询号码归属地,最近又有在研究nodejs,于是就使用C++编写了nodejs的扩展....
分类:编程语言   时间:2014-05-26 05:22:42    阅读次数:374
Git实战(二)原理
上次的博文Git实战(一)版本号控制概述中我们简介了一下版本号控制系统的概念,重点对版本号控制的三种类型进行了分析和对照,从本篇博文開始我们进入Git的世界,首先介绍一下Git实现版本号控制的原理。 Git与SVN等其它版本号控制系统的最重要的一点差别在于,Git仅仅关心文件数据的总体是...
分类:其他好文   时间:2014-05-25 02:07:15    阅读次数:274
云计算大会有感—MapReduce和UDF
(转载请注明出处:http://blog.csdn.net/buptgshengod)1.参会有感      首先还是非常感谢CSDN能给我票,让我有机会参加这次中国云计算峰会。感觉不写点什么对不起CSDN送我的门票(看到网上卖一千多一张呢)。        还是得从国家会议中心说起,两年前lz曾经在那当过IDF的志愿者,当时是纯体力劳动,负责给参会人员发一些杂志什么的,当时苦逼的为了多蹭一个盒饭...
分类:其他好文   时间:2014-05-25 00:59:08    阅读次数:458
《Java并发编程实战》第三章 对象的共享 读书笔记
一、可见性 什么是可见性? Java线程安全需要防止某个线程正在使用对象状态而另一个线程在同时修改该状态,而且需要确保当一个线程修改了对象的状态后,其他线程可以看到发生的状态变化。 后者就是可见性的描述即多线程可以实时获取其他线程修改后的状态。      *** 待补充   两个工人同时记录生产产品总数问题 1. 失效数据 可见性出现问题就是其他线程没有获取到修改后的状态,更直观...
分类:编程语言   时间:2014-05-24 22:17:11    阅读次数:246
Git实战(二)原理
上次的博文Git实战(一)版本控制概述中我们简单介绍了一下版本控制系统的概念,重点对版本控制的三种类型进行了分析和对比,从本篇博文开始我们进入Git的世界,首先介绍一下Git实现版本控制的原理。...
分类:其他好文   时间:2014-05-24 21:05:16    阅读次数:246
java开源框架SpringSide 3.1.4.3开发Web的demo项目实战
java开源框架SpringSide 3.1.4.3开发Web的demo项目实战,代码下载地址:http://www.zuidaima.com/share/1781596496120832.htm...
分类:编程语言   时间:2014-05-24 19:42:50    阅读次数:313
Git实战(三)环境搭建
上次的博文中,我们介绍了一下关于Git作为版本控制工具的基本原理,接下来我们来搭建一个基本的Git环境(由于我使用的是Windows系统,所以重点侧重在这方面)。...
分类:其他好文   时间:2014-05-24 19:24:25    阅读次数:270
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!