本文参考原文 http://bjbsair.com/2020 03 25/tech info/6302/ 今天来看看网红Attention的效果,来自ACL的论文Hierarchical Attention Networks for Document Classification 论文概述 近年来, ...
分类:
其他好文 时间:
2020-03-26 09:13:08
阅读次数:
69
可直接在百度的aistudio中进行实验: 地址:https://aistudio.baidu.com/aistudio/projectdetail/305830 ERNIE 通过建模海量数据中的词、实体及实体关系,学习真实世界的语义知识。相较于 BERT 学习原始语言信号,ERNIE 直接对先验语 ...
分类:
其他好文 时间:
2020-03-06 10:39:14
阅读次数:
337
摘要:上一篇广告中那些趣事系列1:广告统一兴趣建模流程,我们了解了如何为广告主圈人群以及如何刻画用户的兴趣度。要想给用户打标签,我们需要构建数据源和标签的关联,也就是item-tag。针对数量较少的app数据源我们可以使用人工打标的方式来识别,但是对于news、用户query等数量较多的数据源则需要... ...
分类:
其他好文 时间:
2020-03-01 12:39:38
阅读次数:
63
摘要:上一篇广告行业中那些趣事系列2:BERT实战NLP文本分类任务(附github源码)通过项目实战讲解了如何使用BERT模型来完成文本分类任务。本篇则从理论的角度讲解BERT模型的前世今生。BERT虽然在模型创新的角度来说并不是非常出色,但它是近几年NLP领域杰出成果的集大成者。BERT大火最重... ...
分类:
其他好文 时间:
2020-03-01 12:12:00
阅读次数:
94
数据分析的入门思维,首先要认识数据,然后对数据进行简单的分析,比如描述性统计分析和相关性分析等。 一,认识变量和数据 变量和数据是数据分析中常用的概念,用变量来描述事物的特征,而数据是变量的具体值,把变量的值也叫做观测值。 1,变量 变量是用来描述总体中成员的某一个特性,例如,性别、年龄、身高、收入 ...
分类:
其他好文 时间:
2020-02-24 23:50:47
阅读次数:
155
本论文是一篇介绍使用CNN对句子进行分类的论文。本文将介绍使用TensorFlow来实现整个论文的实验过程,一方面熟悉使用TensorFlow API,另一方面加深对CNN在NLP上的应用理解。 对于文本分类问题,常规方法就是抽取文本的特征,使用doc2evc或者LDA模型将文本转换成一个固定维度的 ...
分类:
其他好文 时间:
2020-02-24 13:04:57
阅读次数:
77
文本情感分类 文本分类是自然语言处理的一个常见任务,它把一段不定长的文本序列变换为文本的类别。本节关注它的一个子问题:使用文本情感分类来分析文本作者的情绪。这个问题也叫情感分析,并有着广泛的应用。 同搜索近义词和类比词一样,文本分类也属于词嵌入的下游应用。在本节中,我们将应用预训练的词向量和含多个隐 ...
分类:
其他好文 时间:
2020-02-24 00:27:32
阅读次数:
81
一. TextCNN 是什么 我们之前提前CNN时,通常会认为是属于CV领域,用于计算机视觉方向的工作,但是在2014年,Yoon Kim针对CNN的输入层做了一些变形,提出了文本分类模型textCNN。与传统图像的CNN网络相比, textCNN 在网络结构上没有任何变化(甚至更加简单了), 从图 ...
分类:
其他好文 时间:
2020-02-23 20:20:19
阅读次数:
80
讲授自然语言处理简介、RNN解决NLP问题的一般思路、中文分词、词性标注、命名实体识别、文本分类、机器翻译等具体问题。 大纲 自然语言处理简介RNN在NLP中的应用简介中文分词词性标注命名实体识别文本分类机器翻译 本集内容简介 这节课 ...
分类:
其他好文 时间:
2020-02-22 11:42:07
阅读次数:
53
[toc] 代码分解 代码包括四个部分,分别是: 工具类:utils 训练及测试代码:train_eval 模型:models.TextCNN 主函数:main 在notebook中依次运行前三个部分,最后执行main就可以开始训练了 colab链接:https://colab.research.g ...
分类:
其他好文 时间:
2020-02-20 09:19:27
阅读次数:
161