标签:存在 技术 搜索 info 扫描 优秀 中文分词 http 分享图片
jieba是优秀的中文分词库,中文文本需要通过分词来获的单个词语。jieba库提供了三种分词模式:精确模式,全模式,搜索引擎模式。精确模式是将文本精确割分,不存在冗余。全模式是将文本中所有可能单词都扫描出来,存在冗余。搜索引擎模式是将经过精确模式分割下的长词在进行分割。
常见jieba库的函数
标签:存在 技术 搜索 info 扫描 优秀 中文分词 http 分享图片
原文地址:https://www.cnblogs.com/gzk08-20/p/9216302.html