前言: 需要在百度AI平台注册登录并创建项目。 爬虫代码 1 import scrapy 2 from BaiDuAi.items import BaiduaiItem 3 4 class AiSpider(scrapy.Spider): 5 name = 'ai' 6 # allowed_doma ...
分类:
编程语言 时间:
2018-12-18 19:48:57
阅读次数:
481
一. 中文分词技术 中文自动分词可主要归纳为“规则分词”“统计分词”和“混合分词”,规则分词主要是通过人工设立词库,按照一定方式进行匹配切分,实现简单高效,但对新词很难进行处理,统计分词能够较好应对新词发现能特殊场景,但太过于依赖语料的质量,因此实践中多是采用两者的结合,即混合分词。 1.1 规则分 ...
分类:
编程语言 时间:
2018-12-17 02:42:01
阅读次数:
173
免费人工智能精华课程集锦:1.【入门】机器学习入门:概念原理及常用算法O网页链接2.【应用】机器学习PAI快速入门与业务实战O网页链接3.【MIT出品】深度学习与自动驾驶O网页链接4.【牛津出品】深度学习与自然语言处理O网页链接5.【场景案例】机器学习:信用风险评估评分卡建模方法及原理O网页链接 ...
分类:
其他好文 时间:
2018-12-16 21:41:34
阅读次数:
121
下载:https://pan.baidu.com/s/1u0gYCTbT1I2rq88AFDV3Mg更多资料:http://blog.51cto.com/14050756PDF版,531页,带书签目录,彩色配图,文字可以复制粘贴。配套源代码和数据。系统地讲解了深度学习的基本知识、建模过程和应用,并以深度学习在推荐系统、图像识别、自然语言处理、文字生成和时间序列中的具体应用为案例,详细介绍了从工具准
分类:
编程语言 时间:
2018-12-11 21:52:28
阅读次数:
339
数学基础与语言学基础内容: 数学基础:概率论,(从大规模预料中统计较小的语言单位的相关的统计信息,然后运用统计推理技术计算更高一级的语言单位出现的概率) 语言学基础 实用知识 统计自然语言处理的步骤: 收集自然语言词汇的分布情况; 根据这些分布情况进行统计推导。(最典型的例子:构造统计语言模型) 数 ...
分类:
编程语言 时间:
2018-12-08 21:11:09
阅读次数:
223
下载:https://pan.baidu.com/s/16AFAsJ7JuDy0T5clteGrPA 更多资料:https://pan.baidu.com/s/1g4hv05UZ_w92uh9NNNkCaA 《文本上的算法深入浅出自然语言处理(路彦雄)》PDF,212页,带书签目录,文字可以复制粘贴 ...
分类:
编程语言 时间:
2018-12-06 22:19:46
阅读次数:
351
下载:https://pan.baidu.com/s/1kl7J4DSLIEEbG1b9_ZNw6A 更多资料:https://pan.baidu.com/s/1g4hv05UZ_w92uh9NNNkCaA 《自然语言处理原理与技术实现(罗刚等著)》PDF+源代码 PDF,446页,带书签目录。 配 ...
分类:
编程语言 时间:
2018-12-06 22:16:15
阅读次数:
428
自然语言处理重要应用:机器翻译、数据库技术、语音识别 (——能做成三件业界比较有影响的工程项目工作,才能真正有资格反思自己能做什么工作) 统计自然语言处理技术崛起于80年代初(个人电脑开始普及、大规模存储介质开始出现),目前已成为自然语言处理的主流技术。 自然语言和人工语言最大的区别在于“歧义”二字 ...
分类:
其他好文 时间:
2018-12-06 20:43:54
阅读次数:
243
随着大数据疯狂的浪潮,新生代的工具Python得到了前所未有的爆发。简洁、开源是这款工具吸引了众多粉丝的原因。目前Python最热的领域,非数据分析和挖掘莫属了。从以Pandas为代表的数据分析领域开始,便是Python的天下;一边以实际项目实操,一边跟着已有的资料学习,再辅以相关的理论知识,势必将 ...
分类:
编程语言 时间:
2018-12-06 01:28:00
阅读次数:
238