curl-XPUT‘http://localhost:9200/recommend?pretty‘-d‘{"settings":{ "number_of_replicas":2, "similarity":{ "my_similarity":{ "type":"BM25", "k1":1.2, "b":0.75 }} },"mappings":{"recommend":{"properties":{ "name":{ "type":"string", "similarity":"my_simila..
分类:
其他好文 时间:
2017-05-25 21:59:37
阅读次数:
160
一、引子 BIM(二元如果模型) 近期在优化文本相关性。使用到BM25和BM25F模型。可是发现网络上关于BM25和BM25F模型的介绍比較少,在此总结一下,方便记忆,还有一方面搜了一下相关的资料,发现比較少。写下来欢迎大家查阅。 介绍BM25模型首先要介绍二元独立模型BIM。 如果一:二元如果 所 ...
分类:
其他好文 时间:
2017-04-17 14:25:17
阅读次数:
512
Cobbler的Web管理模块和命令行模块是可以分开工作的,没有依赖关系。 1 WebUI的功能 查看所有的对象和配置文件 添加或者删除system,distro, profile 执行“cobbler sync” 编辑kickstart文件 目前WebUI还未实现的功能 自动导入media 执行" ...
分类:
Web程序 时间:
2017-03-12 16:42:57
阅读次数:
3824
垂直搜索结果的优化包括对搜索结果的控制和排序优化两方面,其中排序又是重中之重。本文将全面深入探讨垂直搜索的排序模型的演化过程,最后推导出BM25模型的排序。然后将演示如何修改lucene的排序源代码,下一篇将深入解读目前比较火热的机器学习排序在垂直搜索中的应用。文章的结构如下: 一、VSM模型简单介 ...
分类:
编程语言 时间:
2017-02-21 01:12:10
阅读次数:
6880
BM25算法,通常用来作搜索相关性平分。一句话概况其主要思想:对Query进行语素解析,生成语素qi;然后,对于每个搜索结果D,计算每个语素qi与D的相关性得分,最后,将qi相对于D的相关性得分进行加权求和,从而得到Query与D的相关性得分。 BM25算法的一般性公式如下: 其中,Q表示Query ...
分类:
其他好文 时间:
2016-10-19 17:02:57
阅读次数:
118
最近需要写几个的算法,做预研,深度学习压力太大了,自己一个人写还是有困难,要是用别人的开源的库,肯定很快,但是,要是出了问题,老师肯定也不会给我顶着。所以选择一个相对尺度小一点的机器学习算法写着玩吧。 其中权重的算法textrank,但是首先要看一下bm25.做相似度计算的。BM25算法,...
分类:
编程语言 时间:
2015-10-24 06:39:25
阅读次数:
549
英文分词的算法和原理 根据文档相关性计算公式 TF-IDF:http://lutaf.com/210.htm BM25:http://lutaf.com/211.htm 分词质量对于基于词频的相关性计算是无比重要的 英文(西方语言)语言的基本单位就是单词,所以分词...
分类:
编程语言 时间:
2015-08-17 06:35:08
阅读次数:
273
BM25算法的全称是 Okapi BM25,是一种二元独立模型的扩展,也可以用来做搜索的相关度排序。Sphinx的默认相关性算法就是用的BM25。Lucene4.0之后也可以选择使用BM25算法(默认是TF-IDF)。如果你使用的solr,只需要修改schema.xml,加入下面这行就可以BM25也...
分类:
编程语言 时间:
2015-06-15 18:15:05
阅读次数:
409
地址:https://en.wikipedia.org/wiki/Okapi_BM25Ininformation retrieval,Okapi BM25(BM stands for Best Matching) is aranking functionused bysearch enginesto...
分类:
编程语言 时间:
2015-06-15 18:14:06
阅读次数:
1356
文章主要介绍搜索引擎文本相关性计算使用的BM25,BM25F模型,以及相关的知识点和理论基础...
分类:
其他好文 时间:
2014-08-25 21:17:34
阅读次数:
995