关于nutch的基础知识能够參考lemo的专栏nutch支持二次开发,为了满足搜索的准确率的问题,考虑只将网页正文的内容提取出来作为索引的内容,相应的是parse_text的数据。我使用的事nutch1.4 版本号,在cygwin下运行crawl命令进行爬取。bin/nutch crawl urls...
分类:
其他好文 时间:
2014-12-31 18:00:36
阅读次数:
207
hmater负责把region均匀到各个region server 。hmaster中有一个线程任务是专门处理负责均衡的,默认每隔5分钟执行一次。每次负载均衡操作可以分为两步:生成负载均衡计划表Assignment Manager 类执行计划表负载均衡方法入口以下代码的Hbase版本为0.96.2在...
分类:
其他好文 时间:
2014-12-31 18:01:32
阅读次数:
308
① 请求方式为GET @GET @Path(value = "/userAddressManage") @Produces( { MediaType.APPLICATION_JSON, "text/html; charset=UTF-8" }) public BuyerAddr...
分类:
其他好文 时间:
2014-12-31 18:00:21
阅读次数:
338
package job;import play.jobs.Every;import play.jobs.Job;import play.jobs.OnApplicationStart;import com.wanhua.weixin.model.AccessToken;/*** * @author ...
分类:
其他好文 时间:
2014-12-31 17:58:14
阅读次数:
411
Export是一个部件(Part)通过容器(Container)向另一个部件提供一个值(Value)。Export特性可修饰类、字段、属性或方法,而Import特性可修饰字段、属性或构造函数参数。为了使Export和Import能够匹配上,双方需要使用同样的Contract,该Contract包括了...
分类:
其他好文 时间:
2014-12-31 18:00:32
阅读次数:
193
1 class Program 2 { 3 static void Main(string[] args) 4 { 5 int num = 2015; 6 data(num); 7 ...
分类:
其他好文 时间:
2014-12-31 17:58:17
阅读次数:
125
1.下载ActiveMQ去官方网站下载:http://activemq.apache.org/2.运行ActiveMQ解压缩apache-activemq-5.5.1-bin.zip,然后双击apache-activemq-5.5.1\bin\activemq.bat运行ActiveMQ程序。启动A...
分类:
其他好文 时间:
2014-12-31 17:58:35
阅读次数:
194
1、Hadoop的包的功能分析 2、由于Hadoop的MapReduce和HDFS都有通信的需求,需要对通信的对象进行序列化。Hadoop并没有采用java的序列化,而是引入它自己的系统。org.apache.hadoop.io中定义了大量的可序列化对象,他们都实现了Writable接口。 3、介绍...
分类:
其他好文 时间:
2014-12-31 17:58:07
阅读次数:
254
从网上看到一个办学历的http://bjxlh.ganji.com.cn/人家说可以办理以下任何一所大学的学历先交3%的订金也就是三千,年底拿证再付余款结果就上当了。说的是找了一个在北大教书的,人家领我过去办理,去了三次,每次到那里都是要钱。一开始不知道是不是骗子,直到第三次让我交二万的安全保证金,...
分类:
其他好文 时间:
2014-12-31 17:59:03
阅读次数:
125
background-size 这个背景属性在移动开发大家应该都有使用,而且会有一种用得很爽的感觉。今天后台哥突然找我说页面中所有的背景图片显示不了。赶紧拿起手机,开启原生的浏览器打开一看,果然...所有背景图片均显示不了(ps:为什么之前没有发现..因为切页面时是用chorme插件看效果得)。有....
分类:
其他好文 时间:
2014-12-31 17:58:42
阅读次数:
130
1.判断路径是文件还是目录File subDir=new File("c:\\mp3");if(subDir.isDirectory()){ // 是目录}File mp3=new File("c:\\mp3\\avemaria.mp3"); if(mp3....
分类:
其他好文 时间:
2014-12-31 17:57:03
阅读次数:
163
1> 排序信息丢失如果在排序操作之后执行了任何其他操作,则不能保证这些附加操作中会保留排序结果。这些操作包括 Select 和 Where 等。另外,采用表达式作为输入参数的 First 和 FirstOrDefault 方法不保留顺序。如下代码:并不能达到反序排序的效果using (var edm...
分类:
其他好文 时间:
2014-12-31 17:58:42
阅读次数:
201
tomcat的热部署实现原理:tomcat启动的时候会有启动一个线程每隔一段时间会去判断应用中加载的类是否发生变法(类总数的变化,类的修改),如果发生了变化就会把应用的启动的线程停止掉,清除引用,并且把加载该应用的WebappClassLoader设为null,然后创建一个新的WebappClas....
分类:
其他好文 时间:
2014-12-31 17:57:48
阅读次数:
280
crontab配置文件并不能看出所有任务需要用命令 crontab -l 查看每次编辑完某个用户的cron设置后,cron自动在/var/spool/cron下生成一个与此用户同名的文件,此用户的cron信息都记录在这个文 件中,这个文件是不可以直接编辑的,只可以用crontab -e 来编辑。cr...
分类:
其他好文 时间:
2014-12-31 17:57:49
阅读次数:
139
EXEmp3 是一款很有趣的软件,它可以将 MP3 文件转换为 .exe 可执行文件格式,并且生成的.exe 文件能够脱离任何播放器自动进行播放。EXEmp3 还允许你创建附加歌词或其他文字信息的 .exe 文件,生成的可执行程序界面也非常精巧美观,你可以在其中方便地调整音量、导入播放列表、设置循环...
分类:
其他好文 时间:
2014-12-31 17:54:49
阅读次数:
116
Entity Framework 的小实例:在项目中添加一个实体类,并做插入操作1>. 创建一个控制台程序2>. 添加一个 ADO.NET实体数据模型,选择对应的数据库与表(StudentModel.edmx)3>. 控件台代码 static void Main(string[] ar...
分类:
其他好文 时间:
2014-12-31 17:54:27
阅读次数:
122
在Hbase中split是一个很重要的功能,Hbase是通过把数据分配到一定数量的region来达到负载均衡的。一个table会被分配到一个或多个region中,这些region会被分配到一个或者多个regionServer中。在自动split策略中,当一个region达到一定的大小就会自动spli...
分类:
其他好文 时间:
2014-12-31 17:55:59
阅读次数:
190