标签:
贝叶斯决策理论要求计算两个概率p1(x,y)和p2(x,y)
1.如果p1(x,y)>p2(x,y),那么类别为1
2.如果p1(x,y)<p2(x,y),那么类别为2
但这两个准则并不是贝叶斯决策理论的所有内容。使用p1()和p2()只是为了尽可能简化描述,而真正需要计算和比较的是p(c1|x,y)和p(c2|x,y)。这些符号所代表的具体意义是:给定某个由x、y表示的数据点,那么该数据点来自类别c1的概率是多少?数据点来自类别c2的概率又是多少?注意这些概率与刚才给出的概率p(x,y|c1)并不一样,不过可以使用贝叶斯准则来交换概率中条件和结果。具体地,应用贝叶斯准则得到:
p(ci|x,y)=p(x,y|ci)*p(ci)/p(x,y)
使用这些定义,可以定义贝叶斯分类准则为:
1.如果p(c1|x,y)>p(c2|x,y),那么属于类别c1
1.如果p(c1|x,y)<p(c2|x,y),那么属于类别c2
朴素贝叶斯分类器中的另一个假设是,每个特征同等重要。
朴素贝叶斯分类器通常有两种实现方式:一种基于贝努利模型实现,一种基于多项式模型实现。前一种方式中并不考虑词在文档中出现的次数,只考虑出不出现。
标签:
原文地址:http://www.cnblogs.com/xiongyuesen/p/4420633.html