标签:
自然语言经过一代又一代的处理,很难依靠明确的规则来表述。简单的NLP:通过比较词频来比较不同的写作风格;复杂的nlp:理解人类语言,并给出相应。
NLP应用:手写字符识别,搜索引擎,机器翻译等;
NLP在学术界,又叫做计算语言学;
Ch1-3:python处理nlp的简单介绍;
Ch4 :结构化的变成来巩固前面的内容,然后是后续的标注/分类/信息提取 ;
Ch5-7 :标注/分类/信息提取;
Ch8-10:语句解析/识别句法结构/构造语义表示;
Ch11:如何有效管理语料数据;
语料库:nltk.corpus;
词化,词根化:nltk.tokenize,nltk.stem
固定搭配:nltk.collocations
标注:nltk.tag
分类:nltk.clasify,nltk.cluster
chunk:nltk.chunk
语法解析:nltk.parse
评估:nltk.metrics
概率和估计:nltk.probablity
应用:nltk.app,nltk.char
标签:
原文地址:http://www.cnblogs.com/Mscer/p/5597160.html