1、计算两个句子相似度,句子表征(工业界效果较好) 参考:https://www.zhihu.com/question/29978268/answer/55338644?utm_source=wechat_session&utm_medium=social&utm_oi=79530219802319 ...
分类:
其他好文 时间:
2019-01-16 11:58:56
阅读次数:
534
最近一直在做多标签分类任务,学习了一种层次注意力模型,基本结构如下: 简单说,就是两层attention机制,一层基于词,一层基于句。 首先是词层面: 输入采用word2vec形成基本语料向量后,采用双向GRU抽特征: 一句话中的词对于当前分类的重要性不同,采用attention机制实现如下: te ...
分类:
Web程序 时间:
2019-01-14 21:22:44
阅读次数:
1037
首先介绍一下Word2Vec Word2Vec:从原始语料中学习字词空间向量的预测模型。主要分为CBOW(Continue Bags of Words)连续词袋模型和Skip-Gram两种模式 CBOW:从原始语句(中国的首都是___)推测目标字词(北京)。Skip-Gram正好相反,从目标词反推原 ...
分类:
其他好文 时间:
2019-01-14 14:32:19
阅读次数:
191
1.功能 采用python的gensim模块训练的word2vec模型,然后采用tensorflow读取模型可视化embedding向量 ps:采用C++版本训练的w2v模型,python的gensim模块读不了。 2.python训练word2vec模型代码 3.tensorflow读取模型可视化 ...
分类:
其他好文 时间:
2019-01-04 19:41:34
阅读次数:
417
1 大纲概述 文本分类这个系列将会有十篇左右,包括基于word2vec预训练的文本分类,与及基于最新的预训练模型(ELMo,BERT等)的文本分类。总共有以下系列: word2vec预训练词向量 textCNN 模型 charCNN 模型 Bi-LSTM 模型 Bi-LSTM + Attention ...
分类:
其他好文 时间:
2019-01-02 15:08:14
阅读次数:
1378
1 大纲概述 文本分类这个系列将会有十篇左右,包括基于word2vec预训练的文本分类,与及基于最新的预训练模型(ELMo,BERT等)的文本分类。总共有以下系列: word2vec预训练词向量 textCNN 模型 charCNN 模型 Bi-LSTM 模型 Bi-LSTM + Attention ...
分类:
其他好文 时间:
2019-01-02 15:07:33
阅读次数:
600
1 大纲概述 文本分类这个系列将会有十篇左右,包括基于word2vec预训练的文本分类,与及基于最新的预训练模型(ELMo,BERT等)的文本分类。总共有以下系列: word2vec预训练词向量 textCNN 模型 charCNN 模型 Bi-LSTM 模型 Bi-LSTM + Attention ...
分类:
其他好文 时间:
2019-01-02 15:02:29
阅读次数:
970
1 大纲概述 文本分类这个系列将会有十篇左右,包括基于word2vec预训练的文本分类,与及基于最新的预训练模型(ELMo,BERT等)的文本分类。总共有以下系列: word2vec预训练词向量 textCNN 模型 charCNN 模型 Bi-LSTM 模型 Bi-LSTM + Attention ...
分类:
其他好文 时间:
2019-01-02 12:54:39
阅读次数:
406
Gensim是一款开源的第三方Python工具包,用于从原始的非结构化的文本中,无监督地学习到文本隐层的主题向量表达。它支持包括TF-IDF,LSA,LDA,和word2vec在内的多种主题模型算法,支持流式训练,并提供了诸如相似度计算,信息检索等一些常用任务的API接口。 1、实现类 2、方法: ...
分类:
其他好文 时间:
2018-12-31 00:03:30
阅读次数:
340
Spark2.x机器学习视频教程讲师:轩宇老师链接:https://pan.baidu.com/s/1TcFl6KDjxJS597TxYFSCOA密码:3t2z本课程讲解Spark在机器学习中的应用,并介绍如何从各种公开渠道获取用于机器学习系统的数据。内容涵盖推荐系统、回归、聚类、分类等经典机器学习算法及其实际应用,涵盖使用SparkMLPipelineAPI创建和调试机器学习流程,内容更加系统、
分类:
其他好文 时间:
2018-12-25 13:57:46
阅读次数:
150