一、引言
在最开始的时候,我本来准备学习的是C4.5算法,后来发现C4.5算法的核心还是ID3算法,所以又辗转回到学习ID3算法了,因为C4.5是他的一个改进。至于是什么改进,在后面的描述中我会提到。
二、ID3算法
ID3算法是一种分类决策树算法。他通过一系列的规则,将数据最后分类成决策树的形式。分类的根据是用到了熵这个概念。熵在物理这门学科中就已经出现过,表示是一个物质的稳定度,在这里就...
分类:
编程语言 时间:
2015-01-04 21:31:19
阅读次数:
180
http://www.52nlp.cn/%E4%B8%AD%E6%96%87%E5%88%86%E8%AF%8D%E5%85%A5%E9%97%A8%E4%B9%8B%E5%AD%97%E6%A0%87%E6%B3%A8%E6%B3%954上一节主要介绍的是利用最大熵工具包来做字标注中文分词,这一节...
分类:
其他好文 时间:
2015-01-04 18:32:28
阅读次数:
274
http://blog.sina.com.cn/s/blog_605f5b4f010109z3.html首先,CRF,HMM(隐马模型),MEMM(最大熵隐马模型)都常用来做序列标注的建模,像词性标注,True casing。但隐马模型一个最大的缺点就是由于其输出独立性假设,导致其不能考虑上下文的特...
分类:
其他好文 时间:
2015-01-04 15:15:08
阅读次数:
438
?1,霍夫曼编码描述哈夫曼树─即最优二叉树,带权路径长度最小的二叉树,经常应用于数据压缩。 在计算机信息处理中,“哈夫曼编码”是一种一致性编码法(又称“熵编码法”),用于数据的无损耗压缩。这一术语是指使用一张特殊的编码表将源字符(例如某文件中的一个符号)进行编码。这张编码表的特殊之处在于,它是根据每一个源字符出现的估算概率而建立起来的(出现概率高的字符使用较短的编码,反之出现概率低的则使用较长的编...
分类:
编程语言 时间:
2014-12-30 23:36:36
阅读次数:
382
熵 熵是表示随机变量不确定性的度量,设X是一个取有限个值的离散随机变量,其概率分布为 则随机变量X的熵定义为 若对数以2为底或以e为底,这时熵的单位分别称为比特或纳特。熵只依赖与X的分布,而与X的取值无关,所以也可将X的熵记作。熵越大,随机变量的不确定性越大。 若一个随机变量只有两个值,那么当X的分...
分类:
其他好文 时间:
2014-12-30 23:33:11
阅读次数:
700
注:HM代码版本为HM-16.2+SCM-3.0rc1/。
在HEVC逆扫描之三:TU逆扫描过程中介绍了TU的逆扫描过程,这里继续介绍CG内部的逆扫描过程。
4x4CG内部的逆扫描流程如下图所示。
图14 4x4CG逆扫描流程
对于每一个4x4块,也是按照与扫描顺序相反的顺序进行逆扫描的。首先通过熵解码解出CG标识(如果是TU内的第一个或者...
分类:
其他好文 时间:
2014-12-28 15:37:20
阅读次数:
185
我的这篇文章《HEVC解码器流程》给出了HEVC解码器的整体流程图,这里主要针对TDecCu部分进行讲解。
TDecCu入口主要有两部分:一部分是decodeCtu,完成的是熵解码和逆扫描;另外一部分是decompressCtu,完成的是预测、反量化、反变换和重构等功能。
具体流程图如下图所示。红色部分表示的是递归函数,对应括号里面完成的是相应的劈分。...
分类:
其他好文 时间:
2014-12-26 11:11:47
阅读次数:
251
学习排序算法(二):Pairwise方法之RankNet
前面一篇博文介绍的Ranking SVM是把LTR问题转化为二值分类问题,而RankNet算法是从另外一个角度来解决,那就是概率的角度。
1. RankNet的基本思想
RankNet方法就是使用交叉熵作为损失函数,学习出一些模型(例如神经网络、决策树等)来计算每个pair的排序得分,学习模型的过程可以使用梯度下降法。...
分类:
编程语言 时间:
2014-12-24 16:21:32
阅读次数:
1832
最近开始做HEVC了,其中熵解码作为最底层的部分,因为和h264差不多,难度系数不是很大,主要是一些查表的操作
具体的实现原理就不细说了,主要从代码来进行解释
首先分析HM工程当中的熵解码的部分作为引导,因为最终要在DSP上进行运行,之后会重写为C代码,流程性更强
代码分析
首先介绍熵解码中比较重要的几个结构体和设计到的函数
一进入main函数,最主要的就是对应的解码类TAppD...
分类:
其他好文 时间:
2014-12-23 19:33:26
阅读次数:
200
虽然熵解码的过程并不是很复杂,但是因为涉及太多的文档和函数比较让人心烦,所以稍微进行一下整理
熵解码一般一开始就是需要对上下文模式进行一定得初始化
在HEVC中
因为是类结构,所以在声明对象的时候,基本就完成了一般的初始化工作,下面详细介绍一下:
在类TDecSbac当中包含所有的上下文模式,但是在HM中有两个对应的结构
ContextModel m_contextMo...
分类:
其他好文 时间:
2014-12-23 19:30:50
阅读次数:
256