在word2vec出现之前,自然语言处理经常把字词转为one-hot编码类型的词向量,这种方式虽然非常简单易懂,但是数据稀疏性非常高,维度很多,很容易造成维度灾难,尤其是在深度学习中;其次这种词向量中任意两个词之间都是孤立的,存在语义鸿沟(这样就不能体现词与词之间的关系)而有Hinton大神提出的D ...
分类:
其他好文 时间:
2019-09-16 09:45:20
阅读次数:
167
简介 一个程序设计语言是一个记号系统,如同自然语言一样,它的完整定义应包括语法和语义两个方面。所谓一个语言的语法是指一组规则,用它可以形成和产生一个合适的程序。目前广泛使用的手段是上下文无关文法,即用上下文无关文法作为程序设计语言语法的描述工具。语法只是定义什么样的符号序列是合法的,与这些符号的含义 ...
分类:
编程语言 时间:
2019-09-12 09:17:32
阅读次数:
92
自然语言处理知识太庞大了,网上也都是一些零零散散的知识,比如单独讲某些模型,也没有来龙去脉,学习起来较为困难,于是我自己总结了一份知识体系结构,不足之处,欢迎指正。内容来源主要参考黄志洪老师的自然语言处理课程。主要参考书为宗成庆老师的《统计自然语言处理》,虽然很多内容写的不清楚,但好像中文NLP书籍 ...
分类:
编程语言 时间:
2019-09-02 11:44:29
阅读次数:
189
2015蒙特利尔深度学习暑期学校之自然语言处理篇 用户1737318 8月3日至8月12日在蒙特利尔举办的深度学习署期学校中,来自不同领域的深度学习顶尖学者 (Yoshua Bengio, Leon Bottou, Chris Manning等)分别作了精彩的报告。报告内容的覆盖面非常广,从基本神经 ...
分类:
其他好文 时间:
2019-09-02 09:20:11
阅读次数:
126
1.C++代码规范: (Googled代码规范): https://zh-google-styleguide.readthedocs.io/en/latest/contents/ 2. <<数学之美>>读后感: 在读这本书之前,自己对于自然语言处理的理解,一直是囿于语言学的思维中,如如何实现词义的上 ...
分类:
其他好文 时间:
2019-09-02 00:01:07
阅读次数:
106
1 gensim是什么? gensim是一个Python常用的的自然语言处理开发包, 主要用于词向量训练和加载词向量,以下解释其正确使用姿势。 2 正确使用姿势 ...
分类:
其他好文 时间:
2019-08-31 23:02:51
阅读次数:
73
编程语言沉思录—编程语言的体系结构 编程语言是一套描述和解释系统 一、语言体系结构: 客观世界 人(描述和解释为) 自然语言 人(描述和解释为) 编程语言 编译器() 指令集、内存地址、内存数据、内存模型 调用指令、算术指令、逻辑指令 编译器 机器指令 计算机: cpu、内存、io 二、描述和解释的 ...
分类:
编程语言 时间:
2019-08-30 11:25:24
阅读次数:
96
Rasa: OpenSource Language Understanding and Dialogue Management 这是一个用于构建会话系统的开源python库,主要由两个部分构成Rasa NLU(自然语言理解) 和Rasa Core(对话管理),这两个软件包都有大量文档,并附带一套全面 ...
分类:
其他好文 时间:
2019-08-24 23:12:49
阅读次数:
167
文本表示是自然语言处理中的基础工作,文本表示的好坏直接影响到整个自然语言处理系统的性能。在自然语言处理研究领域,文本向量化是文本表示的一种重要方式。 顾名思义,文本向量化就是将文本表示成一系列能够表达文本语义的向量。无论中文还是英文,词语都是表达文本处理的最基本单元。 当前阶段,对文本向量化都是通过 ...
分类:
其他好文 时间:
2019-08-24 22:32:52
阅读次数:
100
问题求解(problem solving):将问题形式化、寻找并表达解决方案的过程。?级语言(high-level language):像Python这样被设计成人类容易阅读和编写的编程语言。低级语言(low-level language):被设计成计算机容易运行的编程语?,也被称为 ”机器语 言“ ...
分类:
其他好文 时间:
2019-08-22 21:43:47
阅读次数:
66