首先就是存储员工信息数据。这里将会使用一个文档描述一个员工的“employee
document”形式。实际上在ES中存储数据的动作叫index,但是在我们index一个文档的时候首先要确定去哪里储存数据。在ES中,一个文档是相当于一个type,若干type从属于一个index。可以从下面和关系性数...
分类:
其他好文 时间:
2014-05-09 10:40:21
阅读次数:
239
用这篇日志记录在做毕业课题的一些思考,按时间分割。2014/02至2014/04:
抽了一些时间,看林轩田老师的《机器学习基石》,大致对机器学习、数据挖掘有了一个认识,数据挖掘更侧重于挖掘大量或潜在的数据,从而对一些问题进行分析,机器学习则是通过大量已知数据的训练,形成机器的思维,从而“学会”对.....
分类:
其他好文 时间:
2014-05-09 10:14:27
阅读次数:
289
TheBig Data Zoneis presented bySplunk, the maker of
data analysis solutions such asHunk, an analytics tool for Hadoop, and theSplunk
Web Framework.Liv...
分类:
其他好文 时间:
2014-05-08 19:31:55
阅读次数:
596
本文将告诉你学习Java需要达到的25个目标,希望能够对你的学习及找工作有所帮助。对比一下自己,你已经掌握了这25条中的多少
条了呢? 1.你需要精通面向对象分析与设计(OOA/OOD)、涉及模式(GOF,J2EEDP)以及综合模式。你应该了解UML,尤其是
class,object,interac...
分类:
编程语言 时间:
2014-05-07 19:33:39
阅读次数:
342
这一节我们看下怎样把查询数据放到服务器端存储,这里我们需要使用客户端工具来操作与服务端数据打交道,网上有好多基于.NET开发的SOLR客户端,我们这里选择easynet.solr,很方便的一个DLL,
下载地址:http://easynet.codeplex.com/SourceControl/latest
这一节主要包括Solr数据索引的添加,修改,删除,查询等简单功...
分类:
Web程序 时间:
2014-05-07 05:12:00
阅读次数:
691
目前在做一个winform小软件,其中有一个功能是能根据关键字检索本地保存的word文档。第一次是用com读取word方式(见上一篇文章),先遍历文件夹下的word文档,读取每个文档时循环关键字查找,结果可想而知效率很慢。检索结果是一条接一条显示出来的o(>_
2 /// 创建索引...
分类:
Web程序 时间:
2014-05-07 02:20:56
阅读次数:
428
在Hadoop集群环境下安装Mahout。环境:OS:Centos 6.5 x64 &
Soft:Hadoop 1.2.1 & Mahout
0.91、简介mahout项目主页:https://mahout.apache.org/下载二进制包,上传到服务器。2、安装用集群环境用户安装,解压二进制包。...
分类:
其他好文 时间:
2014-05-05 21:35:23
阅读次数:
429
10个出色的NoSQL数据库NoSQL,泛指非关系型的数据库。虽然NoSQL流行语火起来才短短一年的时间,但是不可否认,现在已经开始了第二代运动。尽管早期的堆栈代码只能算是一种实验,然而现在的系统已经更加的成熟、稳定。不过现在也面临着一个严酷的事实:技术越来越成熟——以至于原来很好的NoSQL数据存...
分类:
数据库 时间:
2014-05-04 11:11:50
阅读次数:
407
Twitter出道之初只是个奋斗在RoR上的小站点,而如今已拥有1.5亿的活跃用户,系统日传输tweet更多达4亿条,并已完成了以服务为核心的系统架构蜕变。
Twitter如今在世界范围内已拥有1.5亿的活跃用户,为了给用户生成timeline(时间轴)需支撑30万QPS,其firehose每秒同样生成22MB数据。整个系统每天传输tweet 4亿条,并且只需要5分钟就可以让一条tweet从Lady Gaga手中呈现到她3100万粉丝的屏幕上。当下Twitter系统的规模及强大的吞吐量确实惹人艳羡,然而在出...
分类:
其他好文 时间:
2014-05-03 16:49:26
阅读次数:
361