码迷,mamicode.com
首页 > 编程语言 > 详细

python学习记录

时间:2020-12-04 11:19:10      阅读:7      评论:0      收藏:0      [点我收藏+]

标签:列表   函数   返回   mamicode   join   技术   int   imp   记录   

jieba

分词

‘‘‘ 
函数 jieba.cut(sentence, cut_all=False)
参数 sentence为待分词的字符串 cut_all为是否为全模式
返回指 生成器
‘‘‘
import jieba
sentence = "我考上了清华大学"
seg_list = jieba.cut(sentence, cut_all=True)
print(‘[全模式]:‘ + ‘/‘.join(seg_list))
seg_list = jieba.cut(sentence, cut_all=False)
print(‘[精确模式]:‘ + ‘/‘.join(seg_list))
‘‘‘
函数 jieba.lcut(sentence, cut_all=False)
参数 sentence为待分词的字符串,cut_all为是否使用全模式
返回值 列表
‘‘‘
import jieba
sentence = "我考上了清华大学"
seg_list = jieba.lcut(sentence, cut_all=True)
print(‘[全模式]:‘ + ‘/‘.join(seg_list))
seg_list = jieba.lcut(sentence, cut_all=False)
print(‘[精确模式]:‘ + ‘/‘.join(seg_list))

技术图片

词性标注

‘‘‘
函数 jieba.posseg.cut(sentence)
参数 setence待分词的字符串
返回值 生成器
同理cut前面加上l返回列表
‘‘‘
import jieba.posseg
sentence = ‘我是中国人‘
for w, p in jieba.posseg.cut(sentence):
    print(w, p)

技术图片

添加字典

‘‘‘
函数 jieba.load_userdict(path)
参数 path添加字典路径
‘‘‘
import jieba
jieba.load_userdict(‘mydict.txt‘)

python学习记录

标签:列表   函数   返回   mamicode   join   技术   int   imp   记录   

原文地址:https://www.cnblogs.com/Serenaxy/p/14060370.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!