搜索关键字：gensim，搜索到87个结果！码迷,mamicode.com！

[PYTHON-TSNE]可视化Word Vector

需要的几个文件： 1.wordList.txt，即你要转化成vector的word list： 2.label.txt, 即图中显示的label，可以与wordlist.txt中的word不同。 3.model，用gensim生成的word2vec model； 4.运行buildWordVecto ...

分类：编程语言时间：2017-06-08 11:59:52 阅读次数：1364

python实现word2vec训练结果bin文件转txt文件

经理让我把word2vec训练后得到的bin文件转为txt文件，目前还不知道txt文件用来干什么。其实word2vec训练语料时可以选择训练处出bin文件或者txt文件，但是训练出bin文件时过程太漫长，我怕直接训练出txt文件也一样慢，所以还是自己想办法做这个事情了。我用到了gensim，这个需 ...

分类：编程语言时间：2017-05-31 12:15:51 阅读次数：398

gensim加载word2vec训练结果(bin文件)并进行相似度实验

# -*- coding: utf-8 -*- import gensim # 导入模型 model = gensim.models.KeyedVectors.load_word2vec_format('vectors.bin', binary=True) # 得到两组词的相似度 list1 = [... ...

分类：其他好文时间：2017-05-31 12:10:24 阅读次数：798

用scikit-learn学习LDA主题模型

在LDA模型原理篇我们总结了LDA主题模型的原理，这里我们就从应用的角度来使用scikit-learn来学习LDA主题模型。除了scikit-learn, 还有spark MLlib和gensim库也有LDA主题模型的类库，使用的原理基本类似，本文关注于scikit-learn中LDA主题模型的使用 ...

分类：其他好文时间：2017-05-26 15:55:42 阅读次数：1445

python 用gensim进行文本相似度分析

http://blog.csdn.net/chencheng126/article/details/50070021 参考于这个博主的博文。原理 1、文本相似度计算的需求始于搜索引擎。搜索引擎需要计算“用户查询”和爬下来的众多”网页“之间的相似度，从而把最相似的排在最前返回给用户。 2、主要使用 ...

分类：编程语言时间：2017-05-21 19:40:52 阅读次数：370

gensim自然语言处理

最近在做词语的相似度做比较，就选用了gensim 首先要安装gensim库，此处省略，参看官网http://radimrehurek.com/gensim/install.html 在网上下了一些词库 {"date": "2016-05-01", "content": "京东家电沸腾五一\n买家电 ...

分类：编程语言时间：2017-05-17 13:51:05 阅读次数：275

Python 文本相似度分析

环境 Anaconda3 Python 3.6, Window 64bit 目的利用 jieba 进行分词，关键词提取利用gensim下面的corpora，models，similarities 进行语料库建立，模型tfidf算法，稀疏矩阵相似度分析代码 # -*- coding: utf-8 ...

分类：编程语言时间：2017-03-29 21:02:54 阅读次数：411

python windows 安装gensim

安装gensim要确定numpy和scipy安装再安装gensim ...

分类：编程语言时间：2017-03-26 23:35:05 阅读次数：224

数据挖掘-Python基本模块

1、numpy：基础模块，高效处理数据、提供数组支持 2、pandas：数据探索和数据分析 3、matplotlib：数据成图模块，解决数据可视化 4、scipy：支持数值计算，支持矩阵运算，提供高等数学处理：积分、傅立叶变换、微分方程求解 5、statsmodels:统计分析 6、gensim：文 ...

分类：编程语言时间：2017-01-09 21:44:37 阅读次数：203

doc2vec使用说明（二）gensim工具包 LabeledSentence

欢迎交流，转载请注明出处。本文介绍gensim工具包中，带标签（一个或者多个）的文档的doc2vec 的向量表示。应用场景：当每个文档不仅可以由文本信息表示，还有别的其他标签信息时，比如，在商品推荐中，将每个商品看成是一个文档，我们想学习商品向量表示时，可以只使用商品的描述信息来学习商品的向量 ...

分类：其他好文时间：2016-09-15 17:57:40 阅读次数：130

共87条上一页 1 ... 5 6 7 8 9 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)