标签:
关键词模糊匹配,如候选词集合为{‘我爱北京天安门’,‘北京西站’,‘上海外滩’},输入‘北京’,要匹配出{‘我爱北京天安门’,‘北京西站’}
想到了如下几种方法:
1. 正则法
将所有关键词集合存入数组或字典中,然后用关键字进行正则匹配。
效率略慢,400万候选词的话,约用时4s
2.reids法
有两种子方法
keys *北京*
官方不推荐这种做法
SSCAN myset 0 MATCH *北京* COUNT 4000000
400万候选词的话,约用时7s
3.mysql法
将关键词集合存入mysql,用like的方式匹配
效率低,400万候选词的话,用时约10s以上
4.分词建索引
实现较难,没有实践经验
标签:
原文地址:http://www.cnblogs.com/tenghuan/p/5236794.html