Motivation 学习CRF的过程中,我发现很多资料,教程上来就给一堆公式,并不知道这些公式是怎么用的。 所以我想以面向问题的形式,分享一下自己对CRF用于序列标注问题的理解 问题定义 应该注意以下几点: 输入$x$是观测序列,是先验条件 输出$Y$是标注序列,也称为状态序列 我们举个例子:(《 ...
分类:
其他好文 时间:
2018-07-01 19:51:55
阅读次数:
241
http://blog.sina.com.cn/s/blog_605f5b4f010109z3.html 首先,CRF,HMM(隐马模型),MEMM(最大熵隐马模型)都常用来做序列标注的建模,像词性标注,True casing。但隐马模型一个最大的缺点就是由于其输出独立性假设,导致其不能考虑上下文的 ...
分类:
其他好文 时间:
2018-06-29 19:27:07
阅读次数:
194
本文是对上文[用CRF做命名实体识别](https://www.cnblogs.com/lookfor404/p/9189429.html)做一次升级。多添加了5个特征(分别是词性,词语边界,人名,地名,组织名指示词),另外还修改了特征模板,最终训练了11个小时,F1值为0.98。 ...
分类:
其他好文 时间:
2018-06-23 01:33:04
阅读次数:
298
对于条件随机场的学习,我觉得应该结合HMM模型一起进行对比学习。首先浏览HMM模型:https://www.cnblogs.com/pinking/p/8531405.html 一、定义 条件随机场(crf):是给定一组输入随机变量条件下,另一组输出随机变量的条件概率的分布模型,其特点是假设输出随机 ...
分类:
其他好文 时间:
2018-06-18 13:26:01
阅读次数:
189
本文主要讲述了关于人民日报标注语料的预处理,利用CRF++工具包对模型进行训练以及测试 ...
分类:
其他好文 时间:
2018-06-16 01:06:30
阅读次数:
236
链接:https://mp.weixin.qq.com/s/BEjj5zJG3QmxvQiqs8P4-w softmax CRF主要用于序列标注问题,可以简单理解为是给序列中的每一帧,既然是分类,很自然想到将这个序列用CNN或者RNN进行编码后,接一个全连接层用softmax激活,如下图所示 逐帧s ...
分类:
其他好文 时间:
2018-05-22 17:18:18
阅读次数:
6543
一、序列标注问题通用概率图结构 如图,对于序列标注问题,第一行的节点是标注标签,第二行是词。 例如“我 爱 美丽的 四川 九寨沟” 第一行节点分别是:代词、动词、形容词、名词、名词 第二行节点分别是:我、爱、美丽的、四川、九寨沟 所以模型的假设是:句子中,相邻词的词性是有逻辑关系的,每个词的词性和词 ...
分类:
其他好文 时间:
2018-05-21 14:53:01
阅读次数:
1018
整理自: https://blog.csdn.net/woaidapaopao/article/details/77806273?locationnum=9&fps=1 HMM CRF HMM和CRF对比 1.HMM算法 隐马尔可夫模型是用于标注问题的生成模型。有几个参数(ππ,A,B):初始状态概 ...
分类:
其他好文 时间:
2018-05-09 22:34:48
阅读次数:
182
根据《统计学习方法》一书中的描述,条件随机场(conditional random field, CRF)是给定一组输入随机变量条件下另一组输出随机变量的条件概率分布模型,其特点是假设输出随机变量构成马尔科夫随机场。 条件随机场是一种判别式模型。 一、理解条件随机场 1.1 HMM简单介绍 HMM即 ...
分类:
其他好文 时间:
2018-05-03 19:29:38
阅读次数:
368
CRFPP/CRF++编译安装与部署下载CRF++https://taku910.github.io/crfpp/#download说明:在上面网站中下载CRF++0.58解压tarzxfCRF++-0.58.tar.gz-C/usr/local/说明:将文件解压到/usr/local/目录下编译安装CRF++-0.58cd/usr/local/CRF++-0.58./configuremakem
分类:
其他好文 时间:
2018-04-08 16:35:50
阅读次数:
1017