码迷,mamicode.com
首页 > 其他好文 > 详细

优秀的中文分词jieba库

时间:2018-06-23 14:35:22      阅读:255      评论:0      收藏:0      [点我收藏+]

标签:存在   技术   搜索   info   扫描   优秀   中文分词   http   分享图片   

jieba库的简介

jieba是优秀的中文分词库,中文文本需要通过分词来获的单个词语。jieba库提供了三种分词模式:精确模式,全模式,搜索引擎模式。精确模式是将文本精确割分,不存在冗余。全模式是将文本中所有可能单词都扫描出来,存在冗余。搜索引擎模式是将经过精确模式分割下的长词在进行分割。
常见jieba库的函数
技术分享图片

技术分享图片

优秀的中文分词jieba库

标签:存在   技术   搜索   info   扫描   优秀   中文分词   http   分享图片   

原文地址:https://www.cnblogs.com/gzk08-20/p/9216302.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!