http://202.38.128.96:96/nlpir/#box-6里面Word2vec比较不错,Python的gensim库可以做来自为知笔记(Wiz)
分类:
其他好文 时间:
2015-08-10 01:53:23
阅读次数:
283
NLP 分词或word2vec之前,一般都需要先进行标点符号的预处理,直接上解决的代码,精简。#!/usr/bin/env python# coding=utf-8from string import punctuationimport reimport sysreload(sys)sys.setd...
分类:
其他好文 时间:
2015-07-27 18:13:23
阅读次数:
316
#include
#include
#include
#include
#include #define MAX_STRING 100
#define EXP_TABLE_SIZE 1000
#define MAX_EXP 6
#define MAX_SENTENCE_LENGTH 1000
#d...
分类:
其他好文 时间:
2015-07-08 19:04:55
阅读次数:
252
序Word2Vec原生是不支持Windows的,索性就用Qt移植了一下。大概做了下面几件事。①替换LinuxAPI的pthread为QThread。②取消了posix_memalign(),内存对齐这玩意据说是编译器的活,不知道Mikolov为什么写出来,难道说源码是Google万能工程师+编译器高...
分类:
其他好文 时间:
2015-06-30 18:04:43
阅读次数:
180
Reference:http://blog.csdn.net/itplus/article/details/37969519 (Word2Vec解析(部分有错))源码:https://github.com/danielfrg/word2vec (Python封装C版,原Code.Google被墙了)...
分类:
其他好文 时间:
2015-06-26 19:27:24
阅读次数:
686
参考资料:http://ir.dlut.edu.cn/NewsShow.aspx?ID=291http://www.douban.com/note/298095260/http://machinelearning.wustl.edu/mlpapers/paper_files/BengioDVJ03....
分类:
其他好文 时间:
2015-06-18 19:07:51
阅读次数:
326
第二讲:简单的词向量表示:word2vec,Glove(Simple Word Vector representations: word2vec, GloVe)转载请注明出处及保留链接“我爱自然语言处理”:http://www.52nlp.cn本文链接地址:斯坦福大学深度学习与自然语言处理第二讲:词...
分类:
编程语言 时间:
2015-06-12 18:55:13
阅读次数:
685
有感于最近接触到的一些关于深度学习的知识,遂打算找个东西来加深理解。首选的就是以前有过接触,且火爆程度非同一般的word2vec。严格来说,word2vec的三层模型还不能算是完整意义上的深度学习,本人确实也是学术能力有限,就以此为例子,打算更全面的了解一下这个工具。在此期间,参考了[1][2].....
分类:
其他好文 时间:
2015-06-10 22:23:39
阅读次数:
667
继上次分享了经典统计语言模型,最近公众号中有很多做NLP朋友问到了关于word2vec的相关内容, 本文就在这里整理一下做以分享。 本文分为
概括word2vec
相关工作
模型结构
Count-based方法 vs. Directly predict
几部分,暂时没有加实验章节,但其实感觉word2vec一文中实验还是做了很多工作的,希望大家有空最好还是看一下。...
分类:
其他好文 时间:
2015-06-07 17:33:51
阅读次数:
480