码迷,mamicode.com
首页 > 编程语言 > 详细

【Python jieba】 -- 2019-08-11 18:43:19

时间:2019-08-11 19:03:08      阅读:99      评论:0      收藏:0      [点我收藏+]

标签:分词   port   结果   分割   jieba   word   col   http   适用于   

原文: http://106.13.73.98/__/131/

安装:pip install jieba

jieba 模块用于将一句或多句话按词组分割为列表.

如下示例:

import jieba


"""cut"""

s = '我就喜欢写代码'

res01 = list(jieba.cut(s))
# ['我', '就', '喜欢', '写', '代码']

# 还可以添加词组:
jieba.add_word('写代码')

res02 = list(jieba.cut(s))
# 添加词组后的结果:
# ['我', '就', '喜欢', '写代码']


"""cut_for_search"""

# cut_for_search方法适用于搜索引擎构建倒排索引的分词,力度比较细

s = '人如果没有梦想,那跟咸鱼有什么区别呢?'

# 添加词组
jieba.add_word('有什么')

res03 = list(jieba.cut_for_search(s))
# 添加词组后,使用cut_for_search的结果:
# ['人', '如果', '没有', '梦想', ',', '那', '跟', '咸鱼', '什么', '有什么', '区别', '呢', '?']

原文: http://106.13.73.98/__/131/

【Python jieba】 -- 2019-08-11 18:43:19

标签:分词   port   结果   分割   jieba   word   col   http   适用于   

原文地址:https://www.cnblogs.com/gqy02/p/11336053.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!