码迷,mamicode.com
首页 > 其他好文 > 详细

集体智慧编程第8章

时间:2014-12-03 13:50:25      阅读:226      评论:0      收藏:0      [点我收藏+]

标签:style   http   io   ar   color   os   sp   for   on   

Wineprice()一瓶酒的价格

Winset1()构建一批酒的价格

Euclideanv1,v2v1v2的欧几里得距离

Data=numpredictWinset1()

Getdistancedatav1)与v1的距离,按序排列了

Knnestimatedatavec1k=5),返回与v1距离最近的datak个点的平均距离

Gaussiandistsigma=10)高斯权重函数

Weightknndatavec1k=5weightf=gaussian)返回与vec1距离最近k个点的加权距离,距离越近,影响越大

Dividedatadatatest=0.05),将data分为训练集和测试集并返回,测试集占0.05

Testalgorithmalgftrainsettestset//algf接受是哪个算法,knnestimateweightknn?返回测试的误差率

Crossvalidatealgfdatatrials=100test=0.05//trials组划分,对每一组划分求误差率,最后对trials划分误差求平均值

Def knn3dv):return knnestimatedv,k=3)、、不同的k调整knnestimate

Wineset2()加上一些其他的变量影响酒的价格,ratingageaislebottlesize

Rescaledatascale)将各个参数归一化,将data中的数据乘以各个scalei

Wineset3()//构建一个有的具有打折的酒的价格的数据集//导致不对称分布

Probguessdata,vec1,low,high,k=5,weightf=guassian),近邻点的价格是否落在lowhigh之间,是的话加入权重得nweight,所有权重之和为tweight,返回nweight/tweight相除的结果

绘制概率分布需要下载matplotlib,在http://matplotlib.sourceforge.net处下载

Cumulativegraphdatavect1highk=5,weightf=gaussian//这种绘制的是累积概率

概率分布:每个价位点的概率等于其周边概率的一个加权平均

Probalilitygraphdatavect1high,靠,weightf=gaussianss=5.0

 

 

集体智慧编程第8章

标签:style   http   io   ar   color   os   sp   for   on   

原文地址:http://www.cnblogs.com/huicpc0212/p/4139757.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!