文本情感分类 文本分类是自然语言处理的一个常见任务,它把一段不定长的文本序列变换为文本的类别。本节关注它的一个子问题:使用文本情感分类来分析文本作者的情绪。这个问题也叫情感分析,并有着广泛的应用。 同搜索近义词和类比词一样,文本分类也属于词嵌入的下游应用。在本节中,我们将应用预训练的词向量和含多个隐 ...
分类:
其他好文 时间:
2020-02-24 00:27:32
阅读次数:
81
讲授自然语言处理简介、RNN解决NLP问题的一般思路、中文分词、词性标注、命名实体识别、文本分类、机器翻译等具体问题。 大纲 自然语言处理简介RNN在NLP中的应用简介中文分词词性标注命名实体识别文本分类机器翻译 本集内容简介 这节课 ...
分类:
其他好文 时间:
2020-02-22 11:42:07
阅读次数:
53
1. 比赛信息 比赛地址: "阿里云恶意程序检测新人赛" 比赛介绍:使用自然语言处理的方法对恶意程序的行为(API调用序列)进行分析,实现对恶意程序鉴别及分类。 2. 我的主要工作 1)数据预处理:格式转换csv txt pkl,根据fileid分组数据,排序后生成api序列,用于训练; 2)数据分 ...
分类:
其他好文 时间:
2020-02-20 13:37:04
阅读次数:
76
深度学习(Deep Leaming, DL )属于表示学习( Representation Learning )的范畴,指的是利用具有一定“深度”的模型来自动学习事物的向量表示(vectorial rpresenation)的一种学习范式。目前,深度学习所采用的模型主要是层数在一层以上的神经网络。
... ...
分类:
编程语言 时间:
2020-02-19 23:44:40
阅读次数:
73
编码器—解码器(seq2seq) 在自然语言处理的很多应用中,输入和输出都可以是不定长序列。以机器翻译为例,输入可以是一段不定长的英语文本序列,输出可以是一段不定长的法语文本序列,例如 英语输入:“They”、“are”、“watching”、“.” 法语输出:“Ils”、“regardent”、“ ...
分类:
其他好文 时间:
2020-02-17 12:08:41
阅读次数:
228
在做自然语言处理的过程中,现在智能对话比较火,例如智能客服,智能家电,智能音箱等,我们需要获取用户说话的意图,方便做出正确的回答,这里面就涉及到句子相似度计算的问题,那么本节就来了解一下怎么样来用 Python 实现句子相似度的计算。 句子相似度常用的几种方法: 1、编辑距离 2、杰卡德系数计算 3 ...
分类:
编程语言 时间:
2020-02-15 11:38:38
阅读次数:
97
文本是一类序列数据,一篇文章可以看作是字符或单词的序列,本节将介绍文本数据的常见预处理步骤,预处理通常包括四个步骤: 读入文本 分词 建立字典,将每个词映射到一个唯一的索引(index) 将文本从词的序列转换为索引的序列,方便输入模型 现有的工具可以很好地进行分词,spaCy和NLTK。 使用示例: ...
分类:
编程语言 时间:
2020-02-14 16:22:18
阅读次数:
81
BERT 预训练模型及文本分类 介绍 如果你关注自然语言处理技术的发展,那你一定听说过 BERT,它的诞生对自然语言处理领域具有着里程碑式的意义。本次试验将介绍 BERT 的模型结构,以及将其应用于文本分类实践。 知识点 语言模型和词向量 BERT 结构详解 BERT 文本分类 "BERT" 全称为 ...
分类:
其他好文 时间:
2020-02-08 17:37:21
阅读次数:
96
概念 统计语言模型是NLP的基础,是描述自然语言内在的规律的数学模型。广泛应用于各种自然语言处理问题,如语音识别、机器翻译、分词、词性标注等。 简单地说,统计语言模型就是给定一个句子W(由多个单词w1,w2,w3...组成),计算该句子可信(合理)的概率的模型,即$P(W)=P(w_1,w_2,w_ ...
分类:
编程语言 时间:
2020-02-07 16:29:54
阅读次数:
63
人工智能(Artificial Intelligence) 通过计算机模拟人类智慧,以完成很多只有人类才可以完成,甚至连人类都无法完成的任务 比如专家系统、图像识别、语音识别、自然语言处理、自动驾驶、推荐系统、人机博弈、电脑游戏、机器人等 人类利用计算机完成了很多对人类而言非常困难的工作,但一些人类 ...
分类:
其他好文 时间:
2020-02-06 11:06:33
阅读次数:
84