简介“结巴”中文分词的R语言版本,支持最大概率法(Maximum Probability), 隐式马尔科夫模型(Hidden Markov Model), 索引模型(QuerySegment), 混合模型(MixSegment), 共四种分词模式, 同时有词性标注,关键词提取,文本Simhash相似度比较等功能。项目使用了Rcpp和CppJieba进行开发。特性支持 Windows , Linux操...
分类:
编程语言 时间:
2015-02-17 11:42:32
阅读次数:
376
在2014年终总结中,我提到要对这学期学过的数学课中的部分算法进行仿真实现。《数值分析》和《工程优化》这两门数学课里面还有些专门讲算法的,可以用来仿真。在《随机过程》这门课中,几乎全都是公式推导,定理证明,实在难以仿真实现。最后发现,马尔科夫链这一章比较适合仿真,况且先前也写过类似的程序,更重要的是之前有人也问过关于马氏链的Matlab实现问题。关于马氏链的理论原理在这就不作描述,下面直接用程序来...
分类:
其他好文 时间:
2015-01-27 11:18:00
阅读次数:
224
整篇文章的PDF版本在这里:http://files.cnblogs.com/Frank-Shaw/Machine_Learning_17.pdf希望能够与有相同意愿的小伙伴们一起学习一起讨论。
分类:
其他好文 时间:
2015-01-25 22:23:32
阅读次数:
147
一:HMM解码问题
(1)编程深处无非就是算法和结构,以及各种架构和版本的管理(如Git管理),因此作为程序员算法这一关是绕不过去的;
(2)关于算法,个人比较崇尚的一本书是《算法导论》和ACM实战系类的算法培训;
(3)对于自然语言处理领域或者部分机械学习领域的算法,HMM模型是非常经典的算法之一,非常适合初学者学习和研究;
(4)HMM模型μ=(A,B,π),的状态是不可见...
分类:
其他好文 时间:
2015-01-19 10:53:05
阅读次数:
234
一:HMM解码问题
(1)给定一个观察序列O=O1O2...OT,和模型μ=(A,B,π),如何快速有效地选择在一定意义下“最优”的状态序列Q=q1q2...qT,使该状态最好地解释观察序列。
(2)最可能的隐藏状态序列(Finding most probable sequence of hidden states);对于一个特殊的隐马尔科夫模型(HMM)及一个相应的观察序列,我们常常希望能找...
分类:
其他好文 时间:
2015-01-16 13:11:21
阅读次数:
232
HMM隐马尔可夫,隐,说明模型里面含有隐含节点,是我们所无法直接观测到的,这些隐含节点上的状态可以称为隐含状态;马尔科夫,说明模型具有马尔科夫性,一个节点的状态只跟它的邻居有关,与其他节点无关,与时间也无关。我们把节点分为两类,状态节点(隐)和可观察节点(显)。并且假设状态节点为链式结构,每个输出(...
分类:
其他好文 时间:
2015-01-12 10:40:45
阅读次数:
217
http://blog.csdn.net/heavendai/article/details/70301021.首先来说一下马尔科夫链。一个事件序列发生的概率可以用下面的概率论里面的乘法公式展开P(w1,w2,…wn) = P(w1)P(w2|w1)P(w3| w1 w2)…P(wn|w1 w2…w...
分类:
其他好文 时间:
2015-01-04 16:30:47
阅读次数:
193
已知条件:三个缸N状态,每个缸中不同颜色球的个数M状态值,时间轴T,观察值序列O参数:状态值序列,转移概率序列求:概率后台代码如下 1 const int N = 3, M = 4;//N状态,M状态值 (0橙色,1绿色,2蓝色,3黄色) 2 public int...
"结巴"中文分词的R语言版本,支持最大概率法(Maximum Probability),隐式马尔科夫模型(Hidden Markov Model),索引模型(QuerySegment),混合模型(MixSegment),共四种分词模式,同时有词性标注,关键词提...
分类:
编程语言 时间:
2014-12-22 11:24:00
阅读次数:
661
1.matlab 和 octave 的使用2.待了解的名词(凸性优化,隐式马尔科夫链)3.一些数据挖掘的定义 : 一个计算机应用程序,假设有一个任务T,然后有一个性能测量方法P,在经验E的 影响下P对T的测量结果得到改进。4.向量机的概念: 用来把一个无限维数的向量变成有限的维数。5.学习性算法的分...
分类:
其他好文 时间:
2014-12-22 00:48:03
阅读次数:
238