标签:
好多年没升级过的Lucene.Net最近居然升级了,到了3.0.3后接口发生了很大变化,原来好多分词库都不能用了,所以上次我把MMSeg给修改了一下支持了Lucene.Net 3.0.3(参考《基于MMSeg算法的中文分词类库》)。
然后我知道了.Net下还有一个盘古分词(http://pangusegment.codeplex.com/),但也不支持Lucene.Net 3.0.3,网上也不少人在问,于是就下载了它的最新代码,基于Lucene.Net 3.0.3更新了,顺便把它的词库给放到dll里面了,不然每次还要拷贝一个Dictionaries目录真麻烦。另外打包放到了Nuget上,方便下载。
https://github.com/JimLiu/Lucene.Net.Analysis.PanGu
另外对比了一下MMSeg和Pangu,发现各有优缺点,没有做特别深入的比较,先用MMSeg好了。
标签:
原文地址:http://www.cnblogs.com/zjoch/p/4467913.html