K-means算法是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一。K-means算法的基本思想是:以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。Mahout kmeans MapReduce实现的原理和上述的一致,值得注意的是,Mahout将数据存储在HDFS,用MapReduce做批量并行的计算。在做kmeans之前,需要将文本用Mahout向量化模块工具做向量化。计算过程主要分为三个步骤:初始中心选取,寻找簇中心,划分数...
分类:
其他好文 时间:
2014-05-26 06:00:31
阅读次数:
239
Dreamweaver CS5 CS6 代码格式化、美化插件(可同时格式化HTML、JavaScript、CSS )目前最好用的代码格式化扩展。
众所周知,Dreamweaver CS5 CS6 自带的“应用源格式”只能单独格式化HTML文件和CSS文件,不能格式化JavaScript文件,更不能同时格式化内嵌在HTML代码里的javascript代码,此插件就是为了替代自带的代码格式化工具而出现的。...
分类:
编程语言 时间:
2014-05-26 05:57:12
阅读次数:
283
对于开源的东东,尤其是刚出来不久,我觉得最好的学习方式就是可以看源码和doc,测试它的例子
为了方便查看源码,关联导入源码的项目
block数据块,在配置文件hdfs-default.xml中可以查看到,记住要修改不是在这里
block文件存储块是最基本的单位
查看block存放位置,配置文件中查看
如果文件大于64M会占两个块,meta文件是校验...
分类:
其他好文 时间:
2014-05-26 05:30:58
阅读次数:
227
题目虽然有点多,但是都是最常见的面试题。如果大家准备参加相关的面试,最好看看。尤其最后的几十个跨国公司面试题。现在国内很多企业都开始学习这套方式,来为难大家。有准备,就容易成功。
即使大家今年不打算找工作,也可以作为一个水平考察,看看自己到底可以应对多少。
面试题1 介绍ASP.NET
答:asp.net是建立在通用语言运行库的程序架构,通过asp.net可以开发出非常强大的Web...
分类:
Web程序 时间:
2014-05-26 03:59:09
阅读次数:
409
胃口大方能吃得多,可是要吃到最美、最好的食物,首先,舍弃眼前这些微不足道的鸡肠、鸭颈吧!
无度不丈夫,量小非君子。头上跑不了马无法做将军,肚子里撑不开船成不了宰相。一个量小的人的胃口里,压根儿就没有搁下荣华富贵的空间。容人容事方成正果。
人们在日常生活中,常常用“百川入海”去形容那些肚量大,能包容种种不同意见、不同看法,能与各种不同性格的人相处,而且也能够经受挫折与打击的人...
分类:
其他好文 时间:
2014-05-25 16:28:39
阅读次数:
200
以前经常在一些网站上注册,但是经常存在一些问题,比如你好不容易把一大堆注册的信息填写好了,然后点击提交,结果弹出个对话框,告诉你哪哪不对,或者说输入了非法字符,然后让你把写错的更改过来,这是好点的,不好的让你都重新写一遍,还有的因为用户名已经被注册,然后返回去让你重新填写用户名,然后原来的某些信息也得重新写一遍,这就特别烦人,我们可不能那么设计啊。
我觉得最好的办法,是在用户输入的时候,通过文本...
分类:
其他好文 时间:
2014-05-25 07:09:20
阅读次数:
170
首先交换机会自带console线一根,现在很少有笔记本带串口了,我的TP也不带,于是买了根转换线,这里要说一下,转换线是需要装驱动的,可以把带的驱动装好,最好是copy一份到网盘里。装好驱动后,可以在设备管理器端口那一栏查查serialtousb的端口COM号,我的本子上提示COM7。我..
分类:
其他好文 时间:
2014-05-25 05:50:53
阅读次数:
370
ASM单点故障
经常由用户询问如何避免ASM单点故障的最佳实践。与其他文件系统或卷管理器一样
ASM实例失效会导致运行在上面的RDBMS实例不可用。然而OS 文件系统或卷管理器失效
一般会伴随操作系统崩溃,而asm重启不需要重启服务器。
解决ASM单点故障的最好的办法是把ASM运行在RAC环境通过集群实现高可用。ASM可以
继续运行在其他节点如果一个节点重启或rdbms重启。ASM失效是...
分类:
数据库 时间:
2014-05-25 00:22:13
阅读次数:
489
百度没出新算法之前这种最好的的优化方案:看到这个标题我相信大家很多人都会呲之以鼻的因为都自己心里感觉这人太装B了吧,谁敢说他的优化方案是最厉害的,首先这只是我感觉的。
自从绿萝算法更新以后咱们这个时候再去更新一篇文章,百度就不会去再从他原先有的数据库里面寻找了,因为这样的话太麻烦太坑爹了,就像一个我们的汶川大地震后的拯救工作太浩大了,就和研究中心里面说的一样,对一篇文章中,抓住10个中心重...
分类:
其他好文 时间:
2014-05-24 18:32:57
阅读次数:
275
条款46 转发函数
难度:3
编写转发函数的最好方式是什么?基本答案很简单,但是我们还是可以学到标准定案之前做出的一个微妙的语言变化。
转发函数是将任务转发给其他函数或对象的有用工具,尤其是在高效完成转发的时候。
评论下面的转发函数。你会修改它吗?如果会,怎样修改?
// file f.cpp
//
#include "f.h"
/*...*/
bool f( X x...
分类:
编程语言 时间:
2014-05-24 18:23:39
阅读次数:
330