码迷,mamicode.com
首页 > 编程语言 > 详细

jieba分词算法使用

时间:2019-07-07 17:48:58      阅读:158      评论:0      收藏:0      [点我收藏+]

标签:style   list()   方法   输出类型   sea   font   导入   返回值   搜索   

第一步:先导入jieba分词包

1 import jieba
2 import jieba.analyse
3 import jieba.posseg

第二步:使用jieba分词的方法

  常用的有:jieba.cut()、jieba.cut_for_search()和jieba.posseg.cut()-----------前者是无词性分词,中间为浏览器搜索,后者是有词性分词

  其中jieba.cut()中除了需要加入被拆分的字符串还可以加入cut_all参数,true为全模式,false为精准模式

  在客服机器人的项目中我使用的是精准模式。

第三步:转换输出类型

  由于jieba.cut()返回的是generator类型,可以通过list()将返回值变为list类型,便于使用。

 

jieba分词算法使用

标签:style   list()   方法   输出类型   sea   font   导入   返回值   搜索   

原文地址:https://www.cnblogs.com/miquel/p/11146734.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!