枚举: 老师给我们讲过一句话,枚举类型的作用就是使程序更加接近自然语言。 在java1.5之前都是将常量设置为final static类型,在java1.5之后,出现了枚举类型,通常将常量设置为枚举常量。 泛型: 泛型的出现时为了解决多态中向上转型和向下转型出现的错误。一般情况下向上转型不会出现错误 ...
分类:
其他好文 时间:
2018-01-17 00:36:40
阅读次数:
178
近些年,深度学习在语音识别、图像处理、自然语言处理等领域都取得了很大的突破与成就。相对来说,深度学习在推荐系统领域的研究与应用还处于早期阶段。 携程在深度学习与推荐系统结合的领域也进行了相关的研究与应用,并在国际人工智能顶级会议AAAI 2017上发表了相应的研究成果《A Hybrid Collab ...
分类:
其他好文 时间:
2018-01-15 22:35:09
阅读次数:
180
与传统的浅层机器学习相比, 深度学习具有优秀的自动提取抽象特征的能力,并且随着分布式计算平台的快速发展,大数据的处理能力得到极大的提升,使得近年来DL在工程界得到广泛的应用,包括图像识别,语音识别,自然语言处理等领域,并取得比传统机器学习更好的效果提升。另一方面,智能推荐系统,本质上是从一堆看似杂乱 ...
分类:
其他好文 时间:
2018-01-13 18:54:14
阅读次数:
1132
http://blog.csdn.net/guixunlong/article/details/8925990 从头开始编写基于隐含马尔可夫模型HMM的中文分词器之一 - 资源篇 首先感谢52nlp的系列博文(http://www.52nlp.cn/),提供了自然语言处理的系列学习文章,让我学习到了 ...
分类:
其他好文 时间:
2018-01-13 18:44:16
阅读次数:
191
实训中的自然语言处理部分,首先就是要分词了,学习一下! 上手jiebaR 使用jiebaR的第一步当然是安装jiabaR包并加载咯 安装: install.packages("jiebaR") 加载: library(jiebaR) 三种分词语句的写法: 结果都是一样的,如下 [1] "我" "希望 ...
分类:
编程语言 时间:
2018-01-08 21:07:32
阅读次数:
3907
from __future__ import division import nltk nltk.download() from nltk.book import * #搜索文本 text1.concordance("monstrous") #出现在相似上下文中德词汇 text1.similar("... ...
分类:
编程语言 时间:
2018-01-08 21:06:21
阅读次数:
187
语料库可以看成一种数据库,里面存储的是语言数据。所谓的语料就是语言数据,有很多种形式,最简单的是文本,此外还有音频,视频等。一句话,一段文字就是一份语料。若干个类似的资料集合在一起就是语料库。对这些语言数据(语料)可以进行标注,以达到增值的目的,这里的价值包括研究价值,商业价值等。现在的语料库一般都 ...
分类:
编程语言 时间:
2018-01-08 16:48:01
阅读次数:
203
自然语言处理-介绍、入门与应用 根据工业界的估计,仅仅只有21%的数据是以结构化的形式展现的。数据由说话,发微博,发消息等各种方式产生。数据主要是以文本形式存在,而这种方式却是高度无结构化的。使用这些文本消息的例子包括:社交网络上的发言,聊天记录,新闻,博客,文章等等。 尽管我们会有一些高维的数据, ...
分类:
编程语言 时间:
2018-01-08 01:18:29
阅读次数:
594
AI(Artificial Intelligence)正在不断的改变着各个行业的形态和人们的生活方式,图像识别、语音识别、自然语言理解等 AI 技术正在自动驾驶、智能机器人、人脸识别、智能助理等领域中发挥着越来越重要的作用。 那么当手绘视频遇到 AI,有 AI 的手绘视频领域,有 AI 的 UWP ...
分类:
其他好文 时间:
2018-01-07 20:08:05
阅读次数:
186
分两部分做. 第一部分是无损文本压缩, 第二部分是sentence level text summarization, 唤作有损文本压缩. 不要对第二部分寄太高期望, 因为大概率完不成, 毕竟我对这一领域之前毫无接触. 无损文本压缩 整体引入. 互联网产生文本太多(?是否是伪命题?)存储和传播如果不 ...
分类:
编程语言 时间:
2018-01-07 14:28:48
阅读次数:
150