Embedding Layer是与特定自然语言处理上的神经网络模型联合学习的单词嵌入。 ...
分类:
其他好文 时间:
2018-09-26 14:55:30
阅读次数:
176
什么是sklearn? sklearn全名是Scikit-Learn,是基于Python的机器学习模块,基于BSD开源许可证,官方网址是:http://scikit-learn.org/stable Scikit-Learn的数据结构基于Numpy和Pandas模块,数据计算基于Scipy模块,数据 ...
分类:
其他好文 时间:
2018-09-25 01:16:32
阅读次数:
233
采用自然语言描述。用自然语言描述的计算过程可能比较容易阅读,但可能比较冗长啰嗦,也容易出现歧义,造成读者的无解。 采用自然语言中结合一些数学公式的描述形式。主要是为了简洁、严格(消除歧义),减少误解的可能性。 采用严格定义的形式化记法形式的描述。例如: 采用某种通用的计算模型的描述方式。这种描述完全 ...
分类:
编程语言 时间:
2018-09-23 18:24:04
阅读次数:
320
词向量作为文本的基本结构——词的模型,以其优越的性能,受到自然语言处理领域研究人员的青睐。良好的词向量可以达到语义相近的词在词向量空间里聚集在一起,这对后续的文本分类,文本聚类等等操作提供了便利,本文将详细介绍如何使用word2vec构建中文词向量。 一、中文语料库 本文采用的是搜狗实验室的搜狗新闻 ...
分类:
其他好文 时间:
2018-09-23 16:22:44
阅读次数:
338
ENSEMBLE: ensemble methods(组合方法)机器学习里面指几种算法的组合在一起的方法。也叫融合学习,集合方法等。 WORD2VEL:word embeddings“词向量”,将自然语言中的字词转为计算机可以理解的稠密向量(Dense Vector)。 RESCALING:再缩放, ...
分类:
其他好文 时间:
2018-09-22 21:54:38
阅读次数:
234
隐马尔可夫(HMM)模型 隐马尔可夫模型,是一种概率图模型,一种著名的有向图模型,一种判别式模型。主要用于时许数据建模,在语音识别、自然语言处理等领域广泛应用。 概率图模型分为两类,一类:使用有向无环图表示变量间的依赖关系,称为有向图模型或者贝叶斯网;第二类:使用无向图表示变量间的依赖关系,称为无向 ...
分类:
其他好文 时间:
2018-09-22 12:44:06
阅读次数:
174
本文主要是基于我自己的学习路径,和大家分享如何系统的学习数据分析,此路可进可退,进可以去做机器学习,如自然语言处理等方向,退可以做数据分析 ...
分类:
其他好文 时间:
2018-09-21 23:13:36
阅读次数:
237
自古以来,人类对人工智能就有持久、狂热的追求,从语音识别到智能音箱,从无人驾驶到人机对战,人工智能给人类社会带来了一次又一次的惊喜,被人工智能赋能的各行各业都在焕发新的生机。在人工智能垂直领域商业化繁荣的背后,是基础层的软硬件支撑,以及技术层的语音识别/自然语言处理、计算机视觉等应用的渐入佳境。2018年8月26日,百度为2018人工智能创意赛集训营邀请了中国高校计算机大赛人工智能创意赛专家委员会
分类:
其他好文 时间:
2018-09-21 19:00:38
阅读次数:
158
小白博主最近想参加一个关于NLP的比赛,于是入坑自然语言处理,想借博客一边学习,一边整理 首先安装库nltk,直接pip install nltk即可 这样,证明库已安装,接下来便可以开始我们的学习了: 搜索文本 1.关键词索引:text1.concordance("words") 从文中找到该wo ...
分类:
编程语言 时间:
2018-09-20 11:08:32
阅读次数:
175
转自公号“机器之心” LSTM入门必读:从入门基础到工作方式详解 转自公号“机器之心” LSTM入门必读:从入门基础到工作方式详解 长短期记忆(LSTM)是一种非常重要的神经网络技术,其在语音识别和自然语言处理等许多领域都得到了广泛的应用。。在这篇文章中,Edwin Chen 对 LSTM 进行了系 ...
分类:
其他好文 时间:
2018-09-15 15:20:07
阅读次数:
181