码迷,mamicode.com
首页 >  
搜索关键字:交叉验证    ( 203个结果
如何调用sklearn模块做交叉验证
终于搞明白了如何用sklearn做交叉验证!!!一般在建立完模型之后,我们要预测模型的好坏,为了试验的可靠性(排除一次测试的偶然性)我们要进行多次测试验证,这时就要用交叉验证。sklearn中的sklearn.cross_validation.cross_val_score函数已经帮我们做好了。直接...
分类:其他好文   时间:2015-07-24 22:32:53    阅读次数:10091
推荐方法和评价指标体系
首先声明。下面的内容项目被视为光明《推荐系统实践》后 书面。从书的基本内容。我只是再次总结他们这(为了避免喷雾器和喷雾)推荐系统,有三种方法来测试所述建议的评价的效果:1)离线实验。 户的行为数据,然后将数据集分成训练数据和測试数据。比方80%的训练数据和20%的測试数据(还能够交叉验证),然后在训...
分类:其他好文   时间:2015-07-24 17:40:16    阅读次数:126
特征选择
具体代码实现参考:手动设置选择特征的个数http://scikit-learn.org/stable/modules/generated/sklearn.feature_selection.RFE.html#sklearn.feature_selection.RFE通过交叉验证自动选择最优特征个数:...
分类:其他好文   时间:2015-07-16 21:23:41    阅读次数:130
K-means的缺点(优化不仅仅是最小化误差)
K-means的缺点(优化不仅仅是最小化误差)#转载时,请注明英文原作David Robinson,译者Ding Chao。#我最近遇到一个交叉验证的问题,我认为这个给我提供了一个很好的机会去用“R”和“ggplot2”探索下K-means算法的一些基本假设。K-means方法广泛用于聚类分析。可是...
分类:其他好文   时间:2015-05-27 20:57:28    阅读次数:1676
交叉验证(Cross-Validation)
交叉验证(Cross-Validation):有时亦称循环估计, 是一种统计学上将数据样本切割成较小子集的实用方法。于是可以先在一个子集上做分析, 而其它子集则用来做后续对此分析的确认及验证。 一开始的子集被称为训练集。而其它的子集则被称为验证集或测试集。WIKI交叉验证对于人工智能,机器学习,模式...
分类:其他好文   时间:2015-05-06 10:42:33    阅读次数:200
R语言数据分析系列之八
再谈多项式回归,本节再次提及多项式回归分析,理解过拟合现象,并深入cross-validation(交叉验证),regularization(正则化)框架,来避免产生过拟合现象,从更加深入的角度探讨理论基础以及基于R如何将理想照进现实。...
分类:编程语言   时间:2015-04-10 18:10:29    阅读次数:354
Python下的数据处理和机器学习,对数据在线及本地获取、解析、预处理和训练、预测、交叉验证、可视化
在[1]: %matplotlib inline 抓取的数据 一个简单的HTTP请求 在[2]: import requests print requests.get("http://example.com").text Example...
分类:编程语言   时间:2015-04-02 16:26:39    阅读次数:192
检测带人声的音乐
部分文献的结果: 印度古典乐的几种简单乐器的演奏,谱减法消去部分背景音初步处理,区分结果: 前提已知-音乐的曲调,消去部分背景音,实验结果: 自己实验的结果: 1120首10折交叉验证的准确率是87.2% 5000首10折交叉验证的准确率是86.40%  耗时 15个小时 截取中间3分钟 5000首10折交叉验证的准确率是86.33%  耗时...
分类:其他好文   时间:2015-02-28 18:46:57    阅读次数:125
检测带人声的音乐
部分文献的结果:印度古典乐的几种简单乐器的演奏,谱减法消去部分背景音初步处理,区分结果:前提已知-音乐的曲调,消去部分背景音,实验结果:针对各类复杂的流行音乐,自己实验的结果:1120首10折交叉验证的准确率是87.2%5000首10折交叉验证的准确率是86.40% 耗时 15个小时截取中间3分钟5...
分类:其他好文   时间:2015-02-28 18:01:37    阅读次数:134
从Kmeans到KD树搜索
Kmeans算法是一种极为常见的聚类算法。其算法过程大意如下:(1)通过问题分析,确定所要聚类的类别数k;(一般是难以直接确定,可以使用交叉验证法等方法,逐步进行确定。)(2)根据问题类型,确定计算数据间相似性的计算方法;(3)从数据集中随机选择k个数据作为聚类中心;(4)利用相似度计算公式,计算每...
分类:其他好文   时间:2015-01-22 11:00:54    阅读次数:244
203条   上一页 1 ... 17 18 19 20 21 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!