码迷,mamicode.com
首页 > 其他好文 > 详细

自然语言处理-感述

时间:2014-09-17 20:34:03      阅读:185      评论:0      收藏:0      [点我收藏+]

标签:使用   数据   sp   问题   代码   c   时间   算法   r   

    最近花了点时间学习nlp--实际只是学习使用nltk和伴随它出现的gensim。

    也许nlp在国内普及的时间还不是很长,绝大多数资料都来自nltk和gensim的官网,国内最多的例子止于演示一下nltk分词/划分词性,有点实效的是一篇用于比较Coursera上课程的相似度的文章,算是我入门学习的一个灯塔(一开始没有nlp的基础,只能先从更好理解的中文内容开始    =_=!  ),不过其中也没有很好的结合语料库,算法也只有LSI的演示,文章内容和代码也欠缺更好的整理(不是在说作者坏话,但的确有不少改进空间。。。)

    除了资料问题外,nlp的场景也有不少门槛。没有更好资源的情况下,也仅仅可以在分词,分析一下少量数据相似情况。也许在大公司内有更多用武之地,但对普及和推动nlp还嫌不足。

    我会将这段时间对nltk的使用过程和代码陆续放上来,希望对需要入门nlp的后人有用。

        

自然语言处理-感述

标签:使用   数据   sp   问题   代码   c   时间   算法   r   

原文地址:http://my.oschina.net/kakablue/blog/314893

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!