本人某Top高校硕士毕业,承接本硕毕业设计和其他相关项目。对于硕士方面,本人可以承接自然语言处理,文本挖掘,数据挖掘,主题模型等相关算法。工程类硕士一般应用系统开发均可。本科相关毕设应用系统均可。本人熟悉的语言有C#、Java、C++,主要从事B/S开发。熟悉论文撰写。本信息常年有效。咨询联系QQ:...
分类:
其他好文 时间:
2015-04-17 13:14:50
阅读次数:
165
本文主要是总结最近学习的论文、书籍相关知识,主要是Natural Language Pracessing(自然语言处理,简称NLP)和Python挖掘维基百科Infobox等内容的知识。
此篇文章主要参考书籍《Natural Language Processing with Python》Python自然语言处理,希望对大家有所帮助。书籍下载地址:
所谓“自然语言”,是指人们日常交流使用的语言,如英语、印地语随着不断演化,很难用明确的规则来刻画。
从广义上,“自然语言处理”(...
分类:
编程语言 时间:
2015-04-16 22:00:32
阅读次数:
405
预备知识
语言模型
[摘自 维基百科]
统计式的语言模型是借由一个概率分布,而指派概率给字词所组成的字串:
语言模型经常使用在许多自然语言处理方面的应用,如语音识别,机器翻译,词性标注,句法分析和资讯检索。由于字词与句子都是任意组合的长度,因此在训练过的语言模型中会出现未曾出现的字串(资料稀疏的问题),也使得在语料库中估算字串的概率变得很困难,这也是要使用近似的平滑n元语法...
分类:
编程语言 时间:
2015-04-06 15:45:25
阅读次数:
226
*博客地址
*收集的不全,以后慢慢补上。排名不分先后。
清华大学自然语言处理与社会人文计算实验室 http://nlp.csai.tsinghua.edu.cn/site2/
清华大学智能技术与系统国家重点实验室信息检索组 http://www.thuir.cn/cms/
哈工大社会计算与信息检索研究中心 http://ir.hit.edu.cn/
哈工大机器智能...
分类:
编程语言 时间:
2015-04-05 22:01:24
阅读次数:
340
1.引言 数据挖掘是知识发现过程中的一个关键步骤,一般是指从大量数据中自动发现隐含的的数据关系,并将其转化为计算机可处理的结构化表示。数据挖掘是计算机学科中的一个交叉研究领域,其研究方法与多个其他科学紧密相连,如:统计、机2器学习、专家系统、信息检索、社会网络、自然语言处理和模式识别等等。 ...
分类:
其他好文 时间:
2015-04-02 18:21:02
阅读次数:
1254
斯坦福大学自然语言处理第四课“语言模型(Language Modeling)”一、课程介绍斯坦福大学于2012年3月在Coursera启动了在线自然语言处理课程,由NLP领域大牛Dan Jurafsky 和 Chirs Manning教授授课:https://class.coursera.org/n...
分类:
编程语言 时间:
2015-03-31 10:38:50
阅读次数:
198
词性的重要性不言而喻,尤其是对于自然语言处理来说,哪怕就是记单词,根据词性对单词进行归组也是非常有帮助的。 superword是一个Java实现的英文单词分析软件,主要研究英语单词音近形似转化规律、前缀后缀规律、...
分类:
其他好文 时间:
2015-03-30 23:17:14
阅读次数:
1390
本文来自CSDN博客,转载请注明出处:http://blog.csdn.net/a635661820/article/details/44730507
参考文献: A Neural Probabilistic Language Model
参照我另一篇NNLM学习介绍的博客, 这一篇是对NNLM的简要实现, 自己简化了一些,输入层到输出层没有连接(加上直连边的真在...
分类:
编程语言 时间:
2015-03-30 09:31:10
阅读次数:
450
【摘要】现代汉语语法信息词典是为计算机实现汉语句子的自动分析与自动生成开发的一部机器词典,它以数据库文件形式收录了5万多条现代汉语的词语,不仅给出了每个词语所属的词类,而且详细描述了它们的各种语法属性。本文介绍这部语法词典的开发历程、内容概要和设计思想,并且举例说明在自然语言处理系统中如何应用这部语...
分类:
其他好文 时间:
2015-03-17 19:50:29
阅读次数:
256
最近试了一下Word2Vec,GloVe以及对应的python版本gensim word2vec和python-glove,就有心在一个更大规模的语料上测试一下,自然而然维基百科的语料进入了视线。维基百科官方提供了一个很好的维基百科数据源:https://dumps.wikimedia.org,可以...
分类:
编程语言 时间:
2015-03-16 22:48:21
阅读次数:
348