首页 > 其他好文 > 详细

对于信息熵的简单理解

时间：2019-07-13 10:53:54 阅读：121 评论：0 收藏：0 [点我收藏+]

标签：www 十分目标 http 是什么先来深度学习就会东北

　　熵，信息熵在机器学习和深度学习中是十分重要的。那么，信息熵到底是什么呢？

　　首先，信息熵是描述的一个事情的不确定性。比如：我说，太阳从东方升起。那么这个事件发生的概率几乎为1，那么这个事情的反应的信息量就会很小。如果我说，太阳从西方升起。那么这就反应的信息量就很大了，这有可能是因为地球的自转变成了自东向西，或者地球脱离轨道去到了别的地方，那么这就可能导致白天变成黑夜，热带雨林将变成沙漠，东北亚将不再是苦寒之地，而是现在的西欧一样的海洋性季风气候，而西欧变成寒带大陆性气候跟现在的东北亚苦寒之地一样。

　　那么，太阳从东方升起这个事件，概率很大，信息量很少，信息熵就会很大。相反，太阳从西方升起，概率很小，信息量很多，信息熵就会很小。因此，信息熵常被用来作为一个系统的信息含量的量化指标，从而可以进一步用来作为系统方程优化的目标或者参数选择的判据。

　　先来一个信息熵的公式：

　　　　技术图片

　　其中：??(??_??)代表随机事件??_??的概率。

　　由上面太阳东升西落，西升东落很容易看出，信息量是随着发生的概率的增大而减少的，而且不能为负。

　　另外，如果我们有两个不相关事件A和B,那么可以得知这两个事情同时发生的信息等于各自发生的信息之和。即h(A,B) = h(A) + h(B)

　　而且，根据贝叶斯定理，p(A,B) = p(A) * p(B)

　　根据上面说到的说熵的定义应该是概率的单调函数。我们很容易看出结论熵的定义 h 应该是概率 p(x) 的 log 函数,因此一个随机变量的熵可以使用以下定义：

　　 $技术图片$

　　此处的负号，仅仅是为了保证熵为正数或者为零，而log函数的基数2可以使任意数，只不过根据普遍传统，使用2作为对数的底。

　　我们用熵来评价整个随机变量x平均的信息量，而平均最好的量度就是随机变量的期望，即熵的定义如下：

　　　　 $技术图片$

　　最终的公式就出来了！还要说明的是，当这个事情一定发生的时候，发生的概率就为1,那么它的信息量为0，信息熵就为0。

对于信息熵的简单理解

标签：www 十分目标 http 是什么先来深度学习就会东北

原文地址：https://www.cnblogs.com/daguonice/p/11179662.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！