交叉验证 交叉验证(Cross-validation)主要用于建模应用中,例如PCR 、PLS 回归建模中。在给定的建模样本中,拿出大部分样本进行建模型,留小部分样本用刚建立的模型进行预报,并求这小部分样本的预报误差,记录它们的平方加和。 交叉验证(Cross-validation)主要用于建模应用 ...
分类:
其他好文 时间:
2017-05-10 19:44:00
阅读次数:
284
据说一个人的标准体重应该是其身高(单位:厘米)减去100、再乘以0.9所得到的公斤数。真实体重与标准体重误差在10%以内都是完美身材(即 |真实体重-标准体重| < 标准体重x10%)。已知1市斤=0.5公斤。现给定一群人的身高和实际体重,请你告诉他们是否太胖或太瘦了。 输入格式: 输入第一行给出一 ...
分类:
其他好文 时间:
2017-05-10 17:54:50
阅读次数:
1134
1.CART分类树的特征选择 分类问题中,假设有K个类,样本点属于第k类的概率为,则概率分布的基尼指数定义为: 如果,集合D根据特征A是否取某一可能值a被分割成和,在特征A的条件下,集合D的基尼指数定义为: 基尼指数代表了模型的不纯度,基尼指数越小,不纯度越小,特征越好. 2.CART分类树的生成算 ...
分类:
其他好文 时间:
2017-05-10 11:15:23
阅读次数:
276
投影的数学意义 A projection is the transformation of points and lines in one plane onto another plane by connecting corresponding points on the two planes wi... ...
分类:
其他好文 时间:
2017-05-10 09:49:20
阅读次数:
298
1 Auto-encoder 目的是提取特征. Auto-encoder能恢复样本训练过程,就保证了隐含层提取的特征是样本的重要,本质的特征,否则不能恢复样本. 2 用样本学习好Auto-encoder, 将时间序列样本,输入训练好的auto-encoder, 如果输出与输入残差值(平方误差和等)小 ...
分类:
Web程序 时间:
2017-05-09 23:18:25
阅读次数:
2309
一、线性回归问题 输入的是特征向量,输出为实数,对于,,模型函数为 衡量误差为平方错误,则Ein为, Eout为未来没有看过的数据资料在模型函数上所得的错误 二、线性回归算法 由Ein可得 目的是求得Ein最小,可知在最低点时Ein最小,即梯度为0的时候 由, 如同,可知 其中 令,可得 输入矩阵X ...
分类:
其他好文 时间:
2017-05-09 21:50:24
阅读次数:
180
BP神经网络是一种按误差反向传播的多层前馈神经网络,含有一个或多个隐含层,其拓扑结构与一般神经网络相似,BP神经网络的隐含层激活函数一般是sigmoid函数,输出层如果是函数逼近,其激活函数一般是线性函数,分类问题其激活函数一般是sigmoid函数 BP神经网络的学习一般分为两部分: 一:正向计算各 ...
分类:
其他好文 时间:
2017-05-08 23:25:27
阅读次数:
223
lms算法跟Rosenblatt感知器相比,主要区别就是权值修正方法不一样。lms采用的是批量修正算法,Rosenblatt感知器使用的是单样本修正算法。两种算法都是单层感知器,也只适用于线性可分的情况。详细代码及说明如下:‘‘‘
算法:最小均方算法(lms)
均方误差:样本预测输出值与实际..
分类:
编程语言 时间:
2017-05-07 21:13:20
阅读次数:
665
本文主要介绍 Redis、MongoDB、PostgreSQL 和 MySQL 数据库空间索引安装配置和使用时需要注意的点,并选取了120万数据对这些数据库的空间索引进行了测试,简单总结了各数据库空间索引的性能和特色以及使用场景。 ...
分类:
数据库 时间:
2017-05-07 19:52:28
阅读次数:
1503
给定样本集D={x1,x2,x3,...xm},K-means算法划分所得簇C={c1,c2,c3,...,ck}的最小平方误差,k表示将数据划分为K簇 E=∑i=1 to k∑x->ci||x-ui||2 ui为簇中心,ui=∑x->cix/|ci| 其中|ci|表示该簇中的样本数,直接计算上面的 ...
分类:
其他好文 时间:
2017-05-06 00:57:07
阅读次数:
178