之前对这个的理解有些问题,今天用到有仔细梳理了一遍,记录一下 首先开启storm tracker机制的前提是, 1. 在spout emit tuple的时候,要加上第3个参数messageid 2. 在配置中acker数目至少为1 3. 在bolt emit的时候,要加上第二个参数anchor t...
分类:
其他好文 时间:
2014-06-25 15:57:09
阅读次数:
251
LDA是一个关于语料的生成概率模型,基本思想是文档可以表达为隐含主题的随机混合,每个主题刻画为关于词语的分布。LDA假设在语料D中生成一篇文章w的过程如下:1.根据泊松分布选在文章长度N2. 选择主题分布3. 对于每一个词Wn (a)根据多项式分布选择一个主题 (b)根据多项式条件概率分布选...
分类:
其他好文 时间:
2014-06-18 21:00:30
阅读次数:
275
1、pig安装 1)解压,重命名、设置环境变量,同hadoop 2)编辑文件$PIG_HOME/conf/pig.properties,增加两行如下内容 fs.default.name=hdfs://hadoop:9000 mapred.job.tracker=hadoop:9001...
分类:
其他好文 时间:
2014-06-14 11:40:40
阅读次数:
205
ubuntu server 安装 mantis bug tracker
中文配置官网:http://www.mantisbt.org/一:安装;1:进入到 apache2的网站目录: cd /var/www2:
下载最新的mantisbt 源程序包 sudo wget 下载url3: 下载完之后是....
分类:
其他好文 时间:
2014-06-06 21:46:29
阅读次数:
291
原文链接: MySQL Memory Allocation -- by Rick James
原文日期: Created 2010; Refreshed Oct, 2012, Jan, 2014
翻译人员: 铁锚
翻译日期: 2014年5月28日
MySQL 内存分配—— 快速设置方案
如果仅使用MyISAM存储引擎,设置 key_buffer_size
为可用内存的20%,(再...
分类:
数据库 时间:
2014-06-05 06:50:03
阅读次数:
507
所谓动态内存分配(Dynamic Memory
Allocation)就是指在程序执行的过程中动态地分配或者回收存储空间的分配内存的方法。动态内存分配不象数组等静态内存分配方法那样需要预先分配存储空间,而是由系统根据程序的需要即时分配,且分配的大小就是程序要求的大小。凡是在程序中用到系统提供的动态分...
分类:
其他好文 时间:
2014-05-31 03:04:45
阅读次数:
356
1 概述Tracker 是一个运行于浏览器书签栏的 JavaScript
嗅探工具,她将被启动于其他网页之后,为了协助您了解目标网页中 JavaScript
的运行情况,包括:执行覆盖率、执行行数、是否存在执行或语法错误等信息,当你对一个目标网页使用 Tracker,该网页的上方将加载进来一个 Tr...
分类:
编程语言 时间:
2014-05-27 16:10:29
阅读次数:
396
原文地址:http://leihuang.net/2014/05/18/Dynamic-Memory-Allocation/
什么是动态内存分配
我们知道数组的元素存储在内存中连续的位置。当一个数组声明的时候,它的内存在编译是被分配。同样,你也能利用动态内存分配来使得内存在运行时分配。
Why Use Dynamic Allocation
当你声明一个数组的时候,数组的大小...
分类:
其他好文 时间:
2014-05-22 08:33:06
阅读次数:
274
主要内容: 1、文本表示与特征提取; 2、隐语义分析LSA和Latent Dirichlet
Allocation(LDA) 3、检索模型:Boolean模型、向量模型、概率模型 1、文本表示与特征提取 文本中抽取出的特征词进行量化来表示文本信息;
利用分词工具:极易中文分词:je-analysis...
分类:
其他好文 时间:
2014-05-21 18:03:26
阅读次数:
486