后续博客会根据上面的图结合一些其他资料更新自然语言处理的朋友多多交流
分类:
编程语言 时间:
2018-04-23 18:37:22
阅读次数:
182
自然语言处理任务数据集 keywords: NLP, DataSet AI Challenger 英中翻译评测 适用领域:机器翻译 规模最大的口语领域英中双语对照数据集。提供了超过1000万的英中对照的句子对作为数据集合。所有双语句对经过人工检查,数据集从规模、相关度、质量上都有保障。 训练集:10 ...
分类:
编程语言 时间:
2018-04-19 23:56:50
阅读次数:
1651
LTP(Language Technology Platform)由哈工大社会计算与信息检索研究中心开发,提供包括中文分词、词性标注、命名实体识别、依存句法分析、语义角色标注等丰富、 高效、精准的自然语言处理技术。 LTP的源码是C++,也提供Java和Python版本。Python版本的安装方法是 ...
分类:
其他好文 时间:
2018-04-18 23:40:35
阅读次数:
1790
下载地址:网盘下载 内容简介 · · · · · · 本书面向所有对机器学习与数据挖掘的实践及竞赛感兴趣的读者,从零开始,以Python编程语言为基础,在不涉及大量数学模型与复杂编程知识的前提下,逐步带领读者熟悉并且掌握当下最流行的机器学习、数据挖掘与自然语言处理工具,如Scikitlearn、N ...
分类:
编程语言 时间:
2018-04-15 14:58:03
阅读次数:
193
2018-04-12 21:20:30 编辑距离是针对二个字符串(例如英文字)的差异程度的量化量测,量测方式是看至少需要多少次的处理才能将一个字符串变成另一个字符串。编辑距离可以用在自然语言处理中,例如拼写检查可以根据一个拼错的字和其他正确的字的编辑距离,判断哪一个(或哪几个)是比较可能的字。DNA ...
分类:
编程语言 时间:
2018-04-13 21:22:41
阅读次数:
256
这里要分享的HanLP是我在学习使用大快DKhadoop大数据一体化平台时使用到的自然语言处理技术,使用这个组建可以很高效的进行自然语言的处理工作,比如进行文章摘要,语义判别以及提高内容检索的精确度和有效性等。
本想找个通俗的案例来介绍一下HanLP,一时间也没想到什么好的案例,索性就从HanLp数据结构HE 分词简单介绍下吧。
分类:
编程语言 时间:
2018-04-12 16:13:29
阅读次数:
210
一、前述 马尔可夫(1856~1922),苏联数学家。切比雪夫的学生。在概率论、数论、函数逼近论和微分方程等方面卓有成就。 马尔可夫模型(Markov Model)是一种统计模型,广泛应用在语音识别,词性自动标注,音字转换,概率文法等各个自然语言处理等应用领域。经过长期发展,尤其是在语音识别中的成功 ...
分类:
其他好文 时间:
2018-04-09 15:06:38
阅读次数:
181
文字、数字、语言 、信息 数字、文字和自然语言一样,都是信息的载体,他们的产生都是为了 记录和传播信息 。 但是貌似数学与语言学的关系不大,在很长一段时间内,数学主要用于天文学、力学。 本章,我们将回顾一下信息时代的发展,看语言学如何慢慢与数学联系起来的。 信息 最开始的时候,人类会用 声音 来传播 ...
分类:
编程语言 时间:
2018-04-07 20:00:04
阅读次数:
376
中国中文信息学会 http://www.cipsc.org.cn/ 中国计算机学会 http://www.ccf.org.cn/ IEEE https://www.ieee.org/ ACL Wiki https://aclweb.org/aclwiki/Main_Page ACL Antholog ...
分类:
编程语言 时间:
2018-04-07 13:50:51
阅读次数:
213
文章转载自http://blog.sina.com.cn/s/blog_574a437f01019poo.html 作者:刘知远THU 入门自然语言处理信息获取与资料查询干货 侵删 ...
分类:
编程语言 时间:
2018-04-07 12:53:12
阅读次数:
196