首页 > 其他好文 > 详细

solr入门之參考淘宝搜索提示功能优化拼音加汉字搜索功能

时间：2017-08-08 14:05:10 阅读：126 评论：0 收藏：0 [点我收藏+]

标签：util params length false src min ram art type

首先看一下从淘宝输入搜索keyword获取到的一些数据信息:

第一张:使用拼音的全程来查询

能够看到提示的是匹配的转换的拼音的方式,看最后一个提示项

这里另一个在指定分类文件夹下搜索的功能,难道后台还存储的类目的信息?

另一个标签的信息要存储
技术分享

技术分享

第二使用首字母来匹配这里看不出来淘宝的东西太多了,首字母直接有了相应的全程
技术分享

技术分享

第三使用切断字母的匹配看的出来走的还是全然匹配的路径
技术分享

技术分享

第四使用汉字匹配的方法 : 这个没得说的这是主功能了
技术分享

技术分享

第五使用拼音加汉字的方式: 可以匹配到使用所有的拼音时这里能看出来是使用了转换的方法了

先将汉字转为拼音在去匹配
技术分享

技术分享

第六这里使用部分这个没啥问题转成拼音后 shouta*
技术分享

技术分享

第七这里应该是先转成拼音为 stao 看以下一张图搜索结果是吻合的,可是结果太少了,

这里淘宝因该使用了另外的搜索机制了.假设这样的方法搜索到的数量不够,那么就使用查询模式

即再放一个分词的字段用来查询, 我想是分成一个一个的模式也就是搜索 s 套了

这里不须要考虑顺序了词中含有这两个就能够了就是以下的结果了

技术分享

技术分享

这里和上面说的是一个道理从这里大家应按能猜出来搜索shtao是没有结果的,能够验证下假设有兴趣
技术分享

技术分享

这里看到没有提示结果,就是没有了

依照推測出来的两种搜索方式

技术分享

淘宝处理

对于拼音加汉字问题应该是使用了双重查询 ,保证汉字是正确匹配的(应该使用的是当个分词字段)

然后再进行汉字转为拼音后的过滤,

学到一点解决拼音加汉字搜索建议的解决方法

新加入一个字段使用全然分词模式即分成一个一个用来做汉字匹配过滤查询

然后再用汉字转拼音查询当数量不够时再使用一次检索查询含有keyword就可以不要求位置在首位

以下是自己的搜索建议改造拼音加汉字的改写

1.加入一个汉字单个分词的字段

schema.xml中配置

<fieldtype name="ng1_1" class="solr.TextField" positionIncrementGap="100">

<analyzer>

<tokenizer class="solr.NGramTokenizerFactory" minGramSize="1" maxGramSize="1"/>

<filter class="solr.LowerCaseFilterFactory"/>

</analyzer>

</fieldtype>

<field name="word_n1" type="ng1_1" indexed="true" stored="false"/>

<copyField source="word" dest="word_n1"/>

2.代码中加入过滤部分

//这里加入过滤--要包括的汉字--使用filter添加查询速度

if(StringFilterUtils.filterAll(q)!=null && StringFilterUtils.filterAll(q).trim().length()>0){

query.set(CommonParams.FQ, BaseSuggestIndex.Fd.word_n1.name()+":"+StringFilterUtils.filterAll(q).trim());

}

对照搜索条件

技术分享

技术分享

技术分享

未优化前

技术分享

技术分享

技术分享

优化后

技术分享

技术分享

技术分享

能够发现汉字输入不对,就不能出来提示了以下是一些输入正确的出来的结果
技术分享

技术分享

技术分享

技术分享

solr入门之參考淘宝搜索提示功能优化拼音加汉字搜索功能

标签：util params length false src min ram art type

原文地址：http://www.cnblogs.com/gccbuaa/p/7306195.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！