在机器学习领域,我们碰到的第一个问题就是:如何选择特征量。
可是看了一些资料,这点好像都是一笔带过,因为很多都是所谓的不可观测量,如何把不可观测量量化呢?这个或许能给机器学习带来新的契机,就像当年牛顿把力、质量、加速度等模糊的概念定义下来,经典物理出现了前所未有的发展,香农把信息量化,造就了信息革命。
以前觉得贝叶斯好像没有大家说的那么神奇,现在知道,是因为当年对它的理解就有问题,贝叶斯更重要的一点应该是能够在加入evidence的情况下,从先验概率进化到后验概率,这点简直就是机器学习的内涵啊
最重要的一点其实就是在知道一个样本的情况下,相应的概率值来选择一种风险最小 效能最高的决策。
而贝叶斯网络可以模糊所谓的数据输入和输出,使监督学习和非监督学习的界限越来越模糊。
我总觉得现在的数据结构已经无法满足如今大数据的需要了,当然也可能是我孤陋寡闻,对很多东西不了解。
《机器学习导论》第三章 贝叶斯决策定理 学习笔记,布布扣,bubuko.com
原文地址:http://www.cnblogs.com/zjjsxuqiang/p/3734445.html