码迷,mamicode.com
首页 > 其他好文 > 详细

你可能不知道的一些机器学习事儿

时间:2015-08-31 21:44:15      阅读:234      评论:0      收藏:0      [点我收藏+]

标签:机器学习   随机森林   正则   长尾分布   


                                  你可能不知道的一些机器学习事儿

       最近零零碎碎地看了很多机器学习方法的东西,增长了不少新知识。有很多小技巧虽然不会出现在教科书中,但它们真的很实用。

(1)随机森林模型不适合用稀疏特征。

(2)测试集必须使用与训练集相同的方法进行预处理。

(3)L1正则(特征选择)最小样本数目m与特征n呈log关系,m = O(log n) ;

         L2正则(旋转不变)最小样本数目m与特征n呈线性关系,m = O(n) 。

(4)标准的PCA是一种线性转换技术。

(5)呈长尾分布的特征通常需要进行对数转换。

(6)线性SVM适合小样本。

(7)AUC适合作为类不平衡问题的衡量标准。

(8)在nested k-foldcross validation中,“外层循环”的目的是模型评估,“内层循环”的目的是模型选择。


版权声明:本文为博主原创文章,未经博主允许不得转载。

你可能不知道的一些机器学习事儿

标签:机器学习   随机森林   正则   长尾分布   

原文地址:http://blog.csdn.net/u011300443/article/details/48139555

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!