码迷,mamicode.com
首页 > 编程语言 > 详细

【Python jieba】 𴱟

时间:2019-08-18 19:43:08      阅读:78      评论:0      收藏:0      [点我收藏+]

标签:com   list   class   搜索引擎   code   构建   结果   分词   _for   

原文: http://blog.gqylpy.com/gqy/356

"安装:pip install jieba

jieba 模块用于将一句或多句话按词组分割为列表.

如下示例:

import jieba


"""cut"""

s = '我就喜欢写代码'

res01 = list(jieba.cut(s))
# ['我', '就', '喜欢', '写', '代码']

# 还可以添加词组:
jieba.add_word('写代码')

res02 = list(jieba.cut(s))
# 添加词组后的结果:
# ['我', '就', '喜欢', '写代码']


"""cut_for_search"""

# cut_for_search方法适用于搜索引擎构建倒排索引的分词,力度比较细

s = '人如果没有梦想,那跟咸鱼有什么区别呢?'

# 添加词组
jieba.add_word('有什么')

res03 = list(jieba.cut_for_search(s))
# 添加词组后,使用cut_for_search的结果:
# ['人', '如果', '没有', '梦想', ',', '那', '跟', '咸鱼', '什么', '有什么', '区别', '呢', '?']

"

原文: http://blog.gqylpy.com/gqy/356

【Python jieba】 𴱟

标签:com   list   class   搜索引擎   code   构建   结果   分词   _for   

原文地址:https://www.cnblogs.com/bbb001/p/11373471.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!