Lucene是一套用于全文检索和搜寻的开源程式库,由Apache软件基金会支持和提供。Lucene提供了一个简单却强大的应用程式接口,能够做全文索引和搜寻。在Java开发环境里Lucene是一个成熟的免费开源工具。就其本身而言,Lucene是当前以及最近几年最受欢迎的免费Java信息检索程序库。—— ...
分类:
Web程序 时间:
2016-09-21 13:04:09
阅读次数:
304
1 什么是pyltp
语言技术平台(LTP) 是由 哈工大社会计算与信息检索研究中心 11
年的持续研发而形成的一个自然语言处理工具库,其提供包括中文分词、词性标注、命名实体识别、依存句法分...
分类:
编程语言 时间:
2016-09-11 00:13:40
阅读次数:
2435
我们的分词技术采用的是“语言云”的平台,语言技术平台(Language Technology Platform,LTP)是哈工大社会计算与信息检索研究中心历时十年研制的一整套开放中文自然语言处理系统。 LTP制定了基于XML的语言处理结果表示,并在此基础上提供了一整套自底向上的丰富、高效、高精度的中 ...
分类:
其他好文 时间:
2016-09-07 20:39:08
阅读次数:
185
了解了“语言云”的相关知识,“语言云” 以哈工大社会计算与信息检索研究中心研发的“语言技术平台(LTP)”为基础,为用户提供高效精准的中文自然语言处理云服务。 使用 “语言云” 非常简单,只需要根据 API 参数构造 HTTP 请求即可在线获得分析结果,而无需下载 SDK 、无需购买高性能的机器,同 ...
分类:
其他好文 时间:
2016-09-06 07:56:25
阅读次数:
222
Apache Pirk (孵化)是一个可扩展的私有信息检索框架(PIR)。Pirk的目标是提供一个强大的,可扩展的,并能具体实现PIR算法的登陆地址。 更多Apache Pirk:可扩展的私有信息检索框架介绍,请查阅勤快学qkxue.net。 ...
分类:
Web程序 时间:
2016-09-05 14:03:11
阅读次数:
160
同样可参考: http://blog.csdn.net/wsywl/article/details/5889419 转自:https://www.douban.com/note/267043565/ 测量相关程度的相关系数很多,各种参数的计算方法及特点各异。 连续变量的相关指标: 此时一般用积差相关 ...
分类:
其他好文 时间:
2016-08-23 01:13:29
阅读次数:
196
第一章:大型网站架构演化 九层之台,始于垒土;千里之行,始于足下。 对于网站的发展,亦是如此,从上世纪90年代开始,互联网经历了20多年的发展,发生了翻天覆地的变化,今天,全球有一半的人使用互联网,从信息检索到实时通信,从电子购物到文化娱乐,互联网渗透到了生活的每一个角落。但是,构建一个高性能的网站 ...
分类:
Web程序 时间:
2016-07-28 16:29:30
阅读次数:
362
yu Code 15 Comments 机器学习(ML),自然语言处理(NLP),信息检索(IR)等领域,评估(Evaluation)是一个必要的 工作,而其评价指标往往有如下几点:准确率(Accuracy),精确率(Precision),召回率(Recall)和F1-Measure。(注: 相对来 ...
分类:
其他好文 时间:
2016-07-22 21:07:15
阅读次数:
940
计算广告学涉及到很多的不同的学科知识,包括大规模搜索,文本分析,机器学习,信息检索以及经济学等等。在计算广告中,其核心问题是在给定的环境下,找到用户和广告之间的最佳匹配,在斯坦福大学的计算广告学中如下的定义:
Computational advertising = A principled way to find the “best match” between a user in a cont...
分类:
其他好文 时间:
2016-07-13 17:30:45
阅读次数:
134
Case Studies: Finding Similar DocumentsLearning Outcomes: By the end of this course, you will be able to:(通过本章的学习,你将掌握) -Create a document retrieval s ...
分类:
系统相关 时间:
2016-07-10 15:15:55
阅读次数:
204