用户行为数据的收集无疑是构建推荐系统的先决条件,而Apache基金会下的Flume项目正是为分布式的日志收集量身打造的,本文是flume基本用法的调研笔记。
本文所用的Flume版本为目前最新版的ver1.5.2,它属于Flume-NG,在系统架构上与Flume-OG有所区别,二者的不同可以参考FlumeWiki文档的说明。
1. Flume是什么
Flume是Apache基金会下的一个开源...
分类:
Web程序 时间:
2015-04-29 19:50:05
阅读次数:
356
使用Lucene.NET实现站内搜索 导入Lucene.NET 开发包 Lucene 是apache软件基金会一个开放源代码的全文检索引擎工具包,是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统...
分类:
Web程序 时间:
2015-04-28 18:10:08
阅读次数:
171
这项研究部分基于NSF制定的EIA-0113539 ITR/SY+PE:“提高软件测试者的教育。” 材料中表达的任何观点、发现和结论或者评论都属于作者,不代表国家科学基金会(NSF)的观点。摘要 设计好的测试用例是一门复杂的艺术。其复杂性有三个原因: 1.测试用例能帮我们发现信息。不同类型的测...
分类:
其他好文 时间:
2015-04-27 18:09:23
阅读次数:
139
BeanUtils简化了写反射时的Java代码,直接使用静态方法setproperty或者copyproperty便可。但是值得注意的是除了要导入beanutils.jar外,还需要导入logging.jar,这两个都是Apache基金会的Commons的项目。另外一个较为坑人的地方是,导入上述两个...
分类:
其他好文 时间:
2015-04-23 15:14:53
阅读次数:
645
Apache Ant,是一个将软件编译、测试、部署等步骤联系在一起加以自动化的一个工具,大多用于Java环境中的软件开发。由Apache软件基金会所提供。Ant是纯Java语言编写的,所以具有很好的跨平台性。一、下载和安装1.1 下载ant的官方下载地址:http://ant.apache.org/...
分类:
其他好文 时间:
2015-04-20 13:00:52
阅读次数:
123
读写Excel三种常用的技术
1.POI
2.JXL
3.FASTEXCEL
POI
Apache POI是Apache软件基金会的开放源代码函数库,POI提供API给java程序对Microsoft Office格式档案读和写的功能。HSSF是Horrible SpreadSheet Format的缩写,及“讨厌的电子表格格式”,通过HSSF,你可以使用纯的java代码来读...
分类:
编程语言 时间:
2015-04-20 09:36:11
阅读次数:
204
转载:http://www.cnblogs.com/jingmoxukong/p/4433945.htmlAnt 简易教程Apache Ant,是一个将软件编译、测试、部署等步骤联系在一起加以自动化的一个工具,大多用于Java环境中的软件开发。由Apache软件基金会所提供。Ant是纯Java语言编...
分类:
其他好文 时间:
2015-04-20 09:19:09
阅读次数:
132
Apache Ant,是一个将软件编译、测试、部署等步骤联系在一起加以自动化的一个工具,大多用于Java环境中的软件开发。由Apache软件基金会所提供。Ant是纯Java语言编写的,所以具有很好的跨平台性。一、下载和安装1.1 下载 ant的官方下载地址:http://ant.apache.org...
分类:
其他好文 时间:
2015-04-20 00:25:09
阅读次数:
114
Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。[1] Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high thro...
分类:
其他好文 时间:
2015-04-19 18:00:31
阅读次数:
108