利用近邻方法,很难量化分类的置信度。而基于概率的分类方法--贝叶斯方法,不仅可以分类,还可以给出分类概率。近邻方法别称为惰性学习方法(lazy learner),当给出数据时,这些分类器只是将他们保存或者记录下来,每次对实例进行训练时,这些分类器都会遍历整个数据集,所以分类器的速度往往跟不上,贝叶斯 ...
分类:
其他好文 时间:
2016-11-16 19:32:44
阅读次数:
318
Atitit ocr识别原理 与概论 attilax总结 1.1. Ocr的过程与流程1 1.2. OCR不同技术细分略有不同,但大概原理是一样的。 即主要技术过程是:二值化(又叫归一化) 行定位 字符切分 字库模型比对(取置信度较高字) 输出2 1.3. Tesseract 图片布局分析 字符分割 ...
分类:
其他好文 时间:
2016-11-02 07:40:12
阅读次数:
402
商品关联分析关联
relevance: 主要用在互联网的内容和文档上,比如搜索引擎算法文档中之间的关联性。association: 用在实际的事物之上,比如电子商务网站上的商品之间的关联度。支持度(support):数据集中包含某几个特定项的概率。
比如在1000次的商品交易中同时出现了啤酒和尿布的次数是50次,那么此关联的支持度为5%。置信度(Confidence):在数据集中已经出现A时,B...
分类:
其他好文 时间:
2016-07-15 21:36:26
阅读次数:
162
商品关联分析关联
relevance: 主要用在互联网的内容和文档上,比如搜索引擎算法文档中之间的关联性。association: 用在实际的事物之上,比如电子商务网站上的商品之间的关联度。支持度(support):数据集中包含某几个特定项的概率。
比如在1000次的商品交易中同时出现了啤酒和尿布的次数是50次,那么此关联的支持度为5%。置信度(Confidence):在数据集中已经出现A时,B...
分类:
其他好文 时间:
2016-07-13 17:13:48
阅读次数:
254
关联规则ASSOCIATION RULE
文本中应用:单词间的并发关系
特点:不考虑序列顺序,而序列挖掘考虑顺序
基本概念:
一个关联规则是一个如下形式的蕴含关系:
x->y,且无交集
支持计数
衡量关联规则强度的指标:
支持度:如果支持度太小,表明该规则很可能只是偶然发生,覆盖的食物很少无价值。
置信度:可预测度,如果置信度太低,表示很难可靠的做出该规则推断。
目标找出所...
分类:
Web程序 时间:
2016-05-07 10:51:25
阅读次数:
326
本文将介绍利用蒙特卡罗方法对误码率进行仿真的基本原理和基本原则。 1. 简介 误码率是通信系统性能评价的一个重要指标,在给定信道、编译码方式下,误码率是一个固定取值。少部分情况下,可以通过理论推导得到理论的误码率,但是在大多数情况下,理论误码率无法推得,这时往往考虑采用蒙特卡罗方法对误码率进行仿真。... ...
分类:
其他好文 时间:
2016-04-25 21:10:50
阅读次数:
309
关联规则的基本模型—规则
关联规则的基本模型—置信度
关联规则的基本模型—支持度
关联规则基本概念
频繁项集举例
关联规则举例
Apriori的步骤
Apriori的重要性质
Apriori算法实例—产生频繁项集
Apriori算法实例—产生关联规则
Apriori算法思想总结
Apriori算法代码
由L(k-1)生成候选集Ck
从频繁项集中挖掘关联规则...
分类:
编程语言 时间:
2016-03-14 19:00:10
阅读次数:
276
综合程序运行情况,样本调查中,结合成本因素,1000人样本足够。1000人样本可以满足95%置信度,d=3%偏离程度,标准误差1.5%精确情况:99%置信度,d=3%偏离程度,标准误差1%,样本数要求2000人左右(精确值1842)。#coding=-utf8#计算最小样本#计算置信区间#非精确计算...
分类:
其他好文 时间:
2015-10-16 18:56:04
阅读次数:
764
关联规则就是形如A->B的表达式,A和B是整个项集中互不相交的两个子项。关联规则挖掘的主要目的在于发现数据中有意义的关联关系。购物篮分析就是通过分析顾客的购买行为来发现不同商品之间的联系。支持度、置信度、提升度支持度(A->B)=|AB|/|S|置信度(A->B)=|AB|/|A|这个基于划分的算法...
分类:
编程语言 时间:
2015-10-08 10:17:32
阅读次数:
333
提到数据挖掘,我们的第一个反应是之前的啤酒和尿布的故事听说过,这个故事是一个典型的数据挖掘关联规则。篮分析的传统线性回归之间的主要差别的差别,对于离散数据的相关性分析;常见的关联规则:关联规则:牛奶=>卵子【支撑=2%,置信度=60%】支持度:分析中的所有事务的2%同一时候购买了牛奶和鸡蛋,需设定域...
分类:
编程语言 时间:
2015-09-21 21:11:10
阅读次数:
254