机器不学习 jqbxx.com-专注机器学习,深度学习,自然语言处理,大数据,个性化推荐,搜索算法,知识图谱 推荐一直是电商平台的重要流量入口。以往在电商平台上,推荐的场景更多的覆盖在交易的各个环节,比如详情页、购物车、订单及支付等。近年来推荐发展逐渐的多样化,场景上逐渐覆盖到各流量入口,推荐的实体 ...
分类:
编程语言 时间:
2018-02-01 19:21:45
阅读次数:
211
机器不学习 jqbxx.com-关注机器学习,深度学习,自然语言处理,大数据,个性化推荐,搜索算法,知识图谱 问题1:什么是循环神经网络RNN? 如下图,如何能让Alpha蚂蚁识别下图的句子(是让它识别句子理解句子而非文字),并且填入正确的答案呢? 如果用以往的方式,Alpha蚂蚁只能看到是这个字以 ...
分类:
其他好文 时间:
2018-02-01 18:28:05
阅读次数:
147
特征选择 RFormula RFormula是一个很方便,也很强大的Feature选择(自由组合的)工具。 输入string 进行独热编码(见下面例子country) 输入数值型转换为double(见下面例子hour) label为string,也用StringIndexer进行编号 卡方独立检验 ...
分类:
编程语言 时间:
2018-01-31 20:24:50
阅读次数:
1193
前言 cutoff是一个比较冷门的概念,相比于DP经典算法的编辑距离,cutoff距离只局限于自然语言处理领域。提出cutoff距离的起因很简单,因为经典的编辑距离无法很好地衡量在字符串搜索过程中的编辑距离。 比如我们要对一个错误的字符串进行纠正,我们会用编辑距离去衡量可能正确字符串和错误字符串之间 ...
分类:
其他好文 时间:
2018-01-30 19:36:05
阅读次数:
175
近些年,深度学习在语音识别、图像处理、自然语言处理等领域都取得了很大的突破与成就。相对来说,深度学习在推荐系统领域的研究与应用还处于早期阶段。 携程在深度学习与推荐系统结合的领域也进行了相关的研究与应用,并在国际人工智能顶级会议AAAI 2017上发表了相应的研究成果《A Hybrid Collab ...
分类:
其他好文 时间:
2018-01-15 22:35:09
阅读次数:
180
与传统的浅层机器学习相比, 深度学习具有优秀的自动提取抽象特征的能力,并且随着分布式计算平台的快速发展,大数据的处理能力得到极大的提升,使得近年来DL在工程界得到广泛的应用,包括图像识别,语音识别,自然语言处理等领域,并取得比传统机器学习更好的效果提升。另一方面,智能推荐系统,本质上是从一堆看似杂乱 ...
分类:
其他好文 时间:
2018-01-13 18:54:14
阅读次数:
1132
http://blog.csdn.net/guixunlong/article/details/8925990 从头开始编写基于隐含马尔可夫模型HMM的中文分词器之一 - 资源篇 首先感谢52nlp的系列博文(http://www.52nlp.cn/),提供了自然语言处理的系列学习文章,让我学习到了 ...
分类:
其他好文 时间:
2018-01-13 18:44:16
阅读次数:
191
实训中的自然语言处理部分,首先就是要分词了,学习一下! 上手jiebaR 使用jiebaR的第一步当然是安装jiabaR包并加载咯 安装: install.packages("jiebaR") 加载: library(jiebaR) 三种分词语句的写法: 结果都是一样的,如下 [1] "我" "希望 ...
分类:
编程语言 时间:
2018-01-08 21:07:32
阅读次数:
3907
from __future__ import division import nltk nltk.download() from nltk.book import * #搜索文本 text1.concordance("monstrous") #出现在相似上下文中德词汇 text1.similar("... ...
分类:
编程语言 时间:
2018-01-08 21:06:21
阅读次数:
187
语料库可以看成一种数据库,里面存储的是语言数据。所谓的语料就是语言数据,有很多种形式,最简单的是文本,此外还有音频,视频等。一句话,一段文字就是一份语料。若干个类似的资料集合在一起就是语料库。对这些语言数据(语料)可以进行标注,以达到增值的目的,这里的价值包括研究价值,商业价值等。现在的语料库一般都 ...
分类:
编程语言 时间:
2018-01-08 16:48:01
阅读次数:
203