码迷,mamicode.com
首页 > 其他好文 > 详细

NLP笔记

时间:2016-10-18 17:59:17      阅读:227      评论:0      收藏:0      [点我收藏+]

标签:

 

词性标注器

>>> text = nltk.word_tokenize(‘what are your name?‘)
>>> text

>>> nltk.pos_tag(text)
[(‘what‘, ‘WDT‘), (‘are‘, ‘VBP‘), (‘your‘, ‘PRP$‘), (‘name‘, ‘NN‘), (‘?‘, ‘.‘)]

 

CC 并列连词

RB 副词

IN 连词

JJ 形容词

 

帮助文档使用

nltk.help.upenn_tagset( ‘RB*‘)

 

text = nltk.Text(word.lower() for word in nltk.corpus.brown.words())

text.similar(‘woman‘)  #找出与woman相似的词

 

nltk.tag.str2tuple()  #已标记的词构建为列表

nltk.corpus.brown.tagged_words()  

nltk.corpus.nps_chat.tagged_words()

nltk.corpus.conll2000.tagged_words()

 

NLP笔记

标签:

原文地址:http://www.cnblogs.com/cppb/p/5974076.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!