Explain
Explain是Pig提供的调试工具,使用explain可以输出Pig Lation的执行计划。值得一提的是,explain支持-dot选项,将执行计划以DOT格式输出, (DOT是一种图形描述语言,请参考http://zh.wikipedia.org/zh/DOT%E8%AF%AD%E8%A8%80)
代码实现详见org.apache.pig.impl.plan.DotPla...
分类:
其他好文 时间:
2014-05-07 06:03:35
阅读次数:
350
1,遇到的问题就是 redis 2.8 版本依赖 Google 的 TCMalloc
TCMalloc(Thread-Caching Malloc)是google开发的开源工具──“google-perftools”中的成员。与标准的glibc库的malloc相比,
TCMalloc在内存的分配上效率和速度要高得多,可以在很大程度上提高MySQL服务器在高并发情况下的性能,降低系统负载...
分类:
其他好文 时间:
2014-05-07 05:41:35
阅读次数:
344
权重随机在项目中经常用到,所以我把它抽象到一个工具类中。
一般实现随机权重有两种方式:
1. 使用一个数组存放权重对应的实际目标,比如A的权重是2,B的权重是3,那么数据长度为5, 数组前两个存放A,后三个存放B。
然后随机一个0-数据长度的数字,直接取数组对应下标的值就可以了。
优点:数据结构简单,算法搞笑,实现简单
缺点:当权重值比较大同时数据又比较多的时候,会浪费内存...
分类:
其他好文 时间:
2014-05-07 05:34:36
阅读次数:
262
这一节我们看下怎样把查询数据放到服务器端存储,这里我们需要使用客户端工具来操作与服务端数据打交道,网上有好多基于.NET开发的SOLR客户端,我们这里选择easynet.solr,很方便的一个DLL,
下载地址:http://easynet.codeplex.com/SourceControl/latest
这一节主要包括Solr数据索引的添加,修改,删除,查询等简单功...
分类:
Web程序 时间:
2014-05-07 05:12:00
阅读次数:
691
使用分词类库,分词类库请参见:http://www.xunsearch.com/scws/
如何使用PHP实现全文检索功能?
很多人可能马上可以想出几种方案,比如:文件检索法、采用SQL的like语句等方法,但这些方法效率都相当的低。
这里介绍一种比较高效的PHP全文检索实现方法,这就是采用MYSQL的FULLTEXT字段类型。但是MYSQL的FULLTEXT字段对中文的支持不是很好,本...
分类:
数据库 时间:
2014-05-07 05:00:43
阅读次数:
513
其实无论用那种测试方法,接口测试的原理是通过测试程序模拟客户端向服务器发送请求报文,服务器接收请求报文后对相应的报文做出处理然后再把应答报文发送给客户端,客户端接收应答报文这一个过程。
方法一、用LoadRunner实现接口测试
大家都知道LoadRunner是一种性能测试工具,但它也可以用在我们做接口测试的时候。开发人员开发出来的接口,提供给测试人员详细的接口使用说明书,该说明书...
分类:
其他好文 时间:
2014-05-07 03:59:14
阅读次数:
545
在使用Unity的时候,很多时候是这样一种引用的关系。就是一个类需要另一个类在其中做工具类。因为是构造方法注入,所以要在构造方法中加入一个引用参数。
public interface IRepository
{
void Execute();
}
public class Repository : IRepository
{...
分类:
其他好文 时间:
2014-05-07 03:57:14
阅读次数:
299
Linux下Tomcat安装配置以及Windows不能连接服务器Tomcat解决方案
一、从官方网站上下载tomcat软件包。
官网地址: http://tomcat.apache.org/
点击左侧的 download的一个版本,我选择的是 tomcat7.0,选择一个后缀名为.tar.gz文件直接下载到本地。
二、通过工具SSH Secure 上传至linux服务器中,进行解压...
分类:
系统相关 时间:
2014-05-07 03:21:00
阅读次数:
625
在UML中活动图的本质就是流程图,它描述了为了完成某一个目标需要做的活动以及这些互动的执行顺序。UML中有两个层面的活动图,一种用于描述用例场景,另一种用于描述对象交互。活动图只是我们用来描述业务目标的达成过程并借此来发现对象的工具,它不是我们的分析目标,也不是编程的依据。建立活动图:一个登录过程的活动图如下:...
分类:
其他好文 时间:
2014-05-06 18:48:15
阅读次数:
297
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。
最常用的就是多表关联查询,主要讲解下join、outer join和semi join的具体使用。
join是最简单的关联操作,两边关联只取交集。
outer join分为left outer join、rig...
分类:
其他好文 时间:
2014-05-06 15:01:38
阅读次数:
269