在word2vec出现之前,自然语言处理经常把字词转为one-hot编码类型的词向量,这种方式虽然非常简单易懂,但是数据稀疏性非常高,维度很多,很容易造成维度灾难,尤其是在深度学习中;其次这种词向量中任意两个词之间都是孤立的,存在语义鸿沟(这样就不能体现词与词之间的关系)而有Hinton大神提出的D ...
分类:
其他好文 时间:
2019-09-16 09:45:20
阅读次数:
167
自然语言处理知识太庞大了,网上也都是一些零零散散的知识,比如单独讲某些模型,也没有来龙去脉,学习起来较为困难,于是我自己总结了一份知识体系结构,不足之处,欢迎指正。内容来源主要参考黄志洪老师的自然语言处理课程。主要参考书为宗成庆老师的《统计自然语言处理》,虽然很多内容写的不清楚,但好像中文NLP书籍 ...
分类:
编程语言 时间:
2019-09-02 11:44:29
阅读次数:
189
2015蒙特利尔深度学习暑期学校之自然语言处理篇 用户1737318 8月3日至8月12日在蒙特利尔举办的深度学习署期学校中,来自不同领域的深度学习顶尖学者 (Yoshua Bengio, Leon Bottou, Chris Manning等)分别作了精彩的报告。报告内容的覆盖面非常广,从基本神经 ...
分类:
其他好文 时间:
2019-09-02 09:20:11
阅读次数:
126
1.C++代码规范: (Googled代码规范): https://zh-google-styleguide.readthedocs.io/en/latest/contents/ 2. <<数学之美>>读后感: 在读这本书之前,自己对于自然语言处理的理解,一直是囿于语言学的思维中,如如何实现词义的上 ...
分类:
其他好文 时间:
2019-09-02 00:01:07
阅读次数:
106
1 gensim是什么? gensim是一个Python常用的的自然语言处理开发包, 主要用于词向量训练和加载词向量,以下解释其正确使用姿势。 2 正确使用姿势 ...
分类:
其他好文 时间:
2019-08-31 23:02:51
阅读次数:
73
文本表示是自然语言处理中的基础工作,文本表示的好坏直接影响到整个自然语言处理系统的性能。在自然语言处理研究领域,文本向量化是文本表示的一种重要方式。 顾名思义,文本向量化就是将文本表示成一系列能够表达文本语义的向量。无论中文还是英文,词语都是表达文本处理的最基本单元。 当前阶段,对文本向量化都是通过 ...
分类:
其他好文 时间:
2019-08-24 22:32:52
阅读次数:
100
本人买的,无私贡献给大家,无解压密码 下载地址: 链接:https://pan.baidu.com/s/1cJtnhEQSXHVMgygr8PHh9A 提取码:a54u ...
分类:
编程语言 时间:
2019-08-20 18:44:15
阅读次数:
120
推出一个半月,斯坦福SQuAD问答榜单前六名都在使用BERT 推出一个半月,斯坦福SQuAD问答榜单前六名都在使用BERT BERT 成为了你做 NLP 时不得不用的模型了……吗? 今日,机器之心小编在刷 Twitter 时,发现斯坦福自然语言处理组的官方账号发布了一条内容:谷歌 AI 的 BERT ...
分类:
其他好文 时间:
2019-08-20 15:22:07
阅读次数:
202
RNN(Recurrent Neural Networks)循环神经网络 广泛应用于自然语言处理(NLP,Natural Language Processing) Back Propagation Through Time Vanishing gradient problem LSTM, 长期依赖, ...
分类:
其他好文 时间:
2019-08-16 20:49:00
阅读次数:
95
1 自然语言处理三大特征抽取器(CNN/RNN/TF)比较 白衣骑士Transformer:盖世英雄站上舞台 华山论剑:三大特征抽取器比较 综合排名情况 以上介绍内容是从几个不同角度来对RNN/CNN/Transformer进行对比,综合这几个方面的实验数据,我自己得出的结论是这样的:单从任务综合效 ...
分类:
其他好文 时间:
2019-08-15 11:06:01
阅读次数:
136