码迷,mamicode.com
首页 >  
搜索关键字:word2vec 词向量    ( 443个结果
【NLP-06】fastText文本分类算法
目录 fastText概述 基础知识 LDA主题模型 总结 一句话简述:fastText提出了子词嵌入(subword embedding)的方法。是一种监督学习方法。和word2vec 中的CBOW结构很相似。运行速度较快。 一、fastText概述 1.1 背景 在word2vec中,我们并没有... ...
分类:编程语言   时间:2020-06-16 20:14:28    阅读次数:76
将word2vec思想拓展到序列item的2vec方法
将word2vec思想拓展到序列item的2vec方法并运用到推荐系统中,实质上可以认为是一种cf 在word2vec中,doc中的word是具有序列关系的,优化目标类似在max对数似然函数 应用在item2vec上,可以有两种看待方式: (1)如果item是强时序关系的,那么对某一次序列中的ite ...
分类:其他好文   时间:2020-06-12 20:28:30    阅读次数:95
A strategy to quantify embedding layer
A strategy to quantify embedding layer Basic idea Embedding is mainly in the process of word pre-training. Two embedding methods, word2vec and GloVe, ...
分类:其他好文   时间:2020-06-11 10:42:26    阅读次数:78
自然语言处理系列---Word2Vec超详细的原理推导
Word2Vec超详细的原理推导(包含负采样和层次softmax) 本文链接:https://blog.csdn.net/bqw18744018044/article/details/90295730 ...
分类:编程语言   时间:2020-06-11 09:11:53    阅读次数:98
【论文阅读】From Word Embeddings To Document Distances
论文介绍的WMD(Word Mover's Distance)是一个基于词嵌入(word embedding)计算两个文本的距离。 本文跳过词嵌入的介绍,直接进入WMD的实现过程。 词的相似性 假设我们有一个包含$n$个词的词典库,用word2vec训练好的这$n$个词的矩阵为: $$X \in R ...
分类:其他好文   时间:2020-06-05 19:29:41    阅读次数:69
Chat with Milvus #12 :新版本、Postgres向量检索插件、比Faiss好用?
Attendee= 参会者 Attendee A:我现在只是属于试用阶段,还没有经过一个比较完整的使用场景的考验,所以现在主要就是说想学习一下,看看别人都是应用到什么样的场景。我们现在实际用的就是一个句子相似性的应用场景,只做了一个很小的测试,没有遇到很明显的问题。之前觉得检索的准确率不是很高,但是 ...
分类:其他好文   时间:2020-05-23 13:32:04    阅读次数:54
word2vec算法原理理解
word2vec简介 word2vec工具主要包含两个模型:跳字模型(skip gram)和连续词袋模型(CBOW),以及两种高效训练的方法:负采样(negative sampling)和层序softmax(hierarchical softmax)。word2vec词向量可以较好地表达不同词之间的 ...
分类:编程语言   时间:2020-05-19 18:20:51    阅读次数:58
12.朴素贝叶斯-垃圾邮件分类
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 句子分词 大小写,标点符号,去掉过短的单词 词性还原:复数、时态、比较级 连接成字符串 2.1 传统方法来实现 2.2 nltk库的安装与使用 pip install nltk import nltk nl ...
分类:其他好文   时间:2020-05-14 13:18:59    阅读次数:66
python读取大词向量文件
[TOC] 0、前言 我们在工作中经常遇到需要将词向量文件读取到内存,但是正常情况下,我们的单词个数都是数十万个,单词的向量都是几百维,所以导致文件比较大,动辄几个G,在读取文件的时候经常会比较慢,有没有什么办法能够加快读取文件的速度呢,接下来,本人将从如下几种方法,进行速度的对比。 1、文件格式 ...
分类:编程语言   时间:2020-05-09 21:13:14    阅读次数:109
Word Representation 词表示
One Hot, N-gram, NNLM 和 Word2Vec 算法 ...
分类:其他好文   时间:2020-05-04 17:07:11    阅读次数:62
443条   上一页 1 ... 3 4 5 6 7 ... 45 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!