算法简介:
K-Means算法是输入聚类个数k,以及包含n个数据对象的数据库,输出满足方差最小标准的k个聚类。并使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中
对象相似度较小。
算法假设:
均方误差是计算群组分散度的最佳参数。
算法输入:
聚类个数k;...
分类:
其他好文 时间:
2014-07-28 00:03:39
阅读次数:
343
信息熵和信息增益
一、信息熵
信息熵是信息论中的基本概念。信息论由Shannon于1948年提出并发展起来,用于解决信息传递过程中的问题,也称统计通信理论。它认为:
1、信息传递由信源、信道和信宿组成;
2、传递系统存在于一个随机干扰环境中,因此传递系统对信息的传递是随机误差的。如果把发送信息记为U而接收到信息记 V,由信道可记为通信模型,为P(U|V)。信道模型是一个条件...
分类:
其他好文 时间:
2014-07-28 00:03:29
阅读次数:
451
数据质量
数据挖掘使用的数据通常是为其他用途收集或者收集的时候还没有明确目的。因此数据常常不能在数据的源头控制质量。为了避免数据质量的问题,所以数据挖掘着眼于两个方面:数据质量问题的检测和纠正(数据清理);使用可以容忍低质量数据的算法。
测量和数据收集问题
完美的数据在实际中几乎是不存在的,对于存在的数据质量问题,我们先定义测量误差和数据收集错误,然后考虑测量误差的各种问题:噪声...
分类:
其他好文 时间:
2014-07-26 15:26:11
阅读次数:
235
似然函数:似然函数在形式上就概率密度函数。 似然函数用来估计某个参数。最大似然函数:就是求似然函数的最大值。 最大似然函数用于估计最好的参数。最小二乘法:它通过最小化误差的平方和寻找数据的最佳函数匹配。就是求 y=a1+a2x的系数。通过最小化误差的平方,然后求系数的偏导数,令导数为0,求...
分类:
其他好文 时间:
2014-07-24 22:50:53
阅读次数:
261
本文出自:http://blog.csdn.net/svitter
Computational Geometry
计算几何
ACM中基本是最麻烦的部分。
几何代码都要自己写,STL中也没有。基本上。
struct point
数乘,差乘,计算几何题目抄。一个数字由于误差积累造成大。
避免误差。
注意:
...
分类:
其他好文 时间:
2014-07-23 20:59:58
阅读次数:
164
工具类 ,直接就可以使用,对于float和double的进行加减乘除长生的误差的解决办法。import java.math.BigDecimal;public class Arith {// 默认除法运算精度private static final int DEF_DIV_SCALE = 10;//...
分类:
其他好文 时间:
2014-07-23 20:44:15
阅读次数:
206
SAD(Sum of Absolute Difference)=SAE(Sum of Absolute Error)即绝对误差和 SATD(Sum of Absolute Transformed Difference)即hadamard变换后再绝对值求和 SSD(Sum of Squared Dif...
分类:
其他好文 时间:
2014-07-22 22:43:32
阅读次数:
246
//注意:51单片机使用12M晶振串口发送数据会有误差而不能工作
// 所以只能使用11.0592M的晶振
main.c
#include
#include
#include "uart.h"
void syn6288(char* tex,unsigned char changdu);
/***********************************...
分类:
其他好文 时间:
2014-07-21 16:38:02
阅读次数:
242
传统的手工盘点过程中盘点前的准备,盘点中盘点登记和盘点后录入工作,都是非常复杂麻烦,工作量大,耗时长,劳动强度大,需要加班加点,人力成本高,更严重的是人工手工登记,录入大量盘点数据,人工误差极高,造成最终盘点结果也不如人意。另外把盘点数据录入到ERP中才知道哪些商品盈亏大,再进行复盘,后知后觉。因此传统的人工盘点是一件“费时,费力,而最终效果不理想的工作”。传统盘点耗时长,而且还需要关门闭店,加班加点熬夜通宵,有的店长经常埋怨:“每个月都要盘点,盘点都得弄上一个星期,这生意还做不做啊?”...
分类:
其他好文 时间:
2014-07-19 02:42:25
阅读次数:
232
一、电脑时间的误差众 所周知,电脑主机的时间是根据电脑晶振以固定频率振荡,从而产生的。由于晶振的不同,会导致电脑时间与UTC时间 (全球标准时间:全球标准时间指的是由世界时间标准设定的时间。原先也被称为格林威治标准时间或者 GMT) 总会存在差异。所以,为了避免电脑时间长期积累下导致的时间偏差越来越...
分类:
系统相关 时间:
2014-07-16 23:41:17
阅读次数:
499