一.ubuntu12.04lts安装 (lts=long term support长期支持)1.在电脑上分出100G的未分配空间(xp:删除逻辑分区,win7:压缩...)2.下载ubuntu系统的镜像文件,如:ubuntu-12.04.4-desktop-i386.ios3.将镜像文件做成启动盘,...
分类:
其他好文 时间:
2014-07-23 12:14:56
阅读次数:
399
In addition to those validations, information is provided with each macro about its specific options.ValidationMacroOptionsValidate acceptance of term...
分类:
其他好文 时间:
2014-07-18 17:15:15
阅读次数:
434
上一篇博文中,我们使用结巴分词对文档进行分词处理,但分词所得结果并不是每个词语都是有意义的(即该词对文档的内容贡献少),那么如何来判断词语对文档的重要度呢,这里介绍一种方法:TF-IDF。 一,TF-IDF介绍 TF-IDF(Term Frequency–Inverse Document F...
分类:
编程语言 时间:
2014-07-18 08:30:03
阅读次数:
620
Setup -> Keyboard对话框中将 Meta key改成: left...
分类:
其他好文 时间:
2014-07-13 16:02:19
阅读次数:
317
在lucene里面,suggest 的支持非常完善,可以随心所欲的定制;但是在es中使用起来就没有那么方便了。es给suggest 分类4类:term ;phrase; completion; context;目前最新版本是es1.2.1 这一块也还在不断完善中;[term suggester](....
分类:
其他好文 时间:
2014-07-13 13:04:41
阅读次数:
1433
Docker常用命令目录搜索镜像获取容器镜像创建实例查看容器列表创建镜像移除一个或多个容器实例删除镜像搜索镜像从Docker Hub搜索镜像. COMAND: $ sudo docker search TERM OPTIONS: --automated=false 是否仅显示自动...
分类:
其他好文 时间:
2014-07-13 08:05:10
阅读次数:
297
在采用FMM (正向最大匹配) 进行中文分词的时候, 可能会存在比较多的交集歧义, 这个时候为了解决交集歧义的问题, 可以采用 FM (Forwar Matching, 正向匹配) 进行中文分词, 正向匹配会在最大匹配的路径上查找所有可能成词的term(这里所有可能成词的term的意思是在构建索引的时候所有切分出来的词, 因为不是路径上的所有节点都会是切分成的词)。
http://blo...
分类:
其他好文 时间:
2014-07-12 22:23:26
阅读次数:
383
问题:客户端无法连接到远程计算机。可能没有启用远程连接或者计算机太忙不能接受新的连接。也可能是网络问题阻止连接。请稍后重新尝试连接。如果问题仍然存在 请与管理员联系。解决方法:1.首先确认远程登陆的服务是打开的,也就是Remote Desktop Services(Windows xp里面是Term...
分类:
其他好文 时间:
2014-07-05 16:46:18
阅读次数:
330
$$\bex \n\cdot{\bf b}=0\ra \n\times [(\n\times {\bf b})\times {\bf b}]=\n\times [\n\cdot ({\bf b}\otimes {\bf b})]. \eex$$证明: 右端第一个分量为 $$\beex \bea &\...
分类:
其他好文 时间:
2014-06-27 22:23:57
阅读次数:
253
1、基础内容
(1)相关概念
分析(Analysis),在Lucene中指的是将域(Field)文本转换成最基本的索引表示单元--项(Term)的过程。在搜索过程中,这些项用于决定什么样的文档能够匹配查词条件。
分析器对分析操作进行了封装,它通过执行若干操作,将文本转化成语汇单元,这个处理过程也称为语汇单元化过程(tokenization),而从文本洲中提取的文本块称为语汇单元(token)...
分类:
其他好文 时间:
2014-06-24 22:55:00
阅读次数:
241