你可能不知道的一些机器学习事儿

时间：2015-08-31 21:44:15 阅读：234 评论：0 收藏：0 [点我收藏+]

你可能不知道的一些机器学习事儿

最近零零碎碎地看了很多机器学习方法的东西，增长了不少新知识。有很多小技巧虽然不会出现在教科书中，但它们真的很实用。

（1）随机森林模型不适合用稀疏特征。

（2）测试集必须使用与训练集相同的方法进行预处理。

（3）L1正则（特征选择）最小样本数目m与特征n呈log关系，m = O(log n) ；

L2正则（旋转不变）最小样本数目m与特征n呈线性关系，m = O(n) 。

（4）标准的PCA是一种线性转换技术。

（5）呈长尾分布的特征通常需要进行对数转换。

（6）线性SVM适合小样本。

（7）AUC适合作为类不平衡问题的衡量标准。

（8）在nested k-foldcross validation中，“外层循环”的目的是模型评估，“内层循环”的目的是模型选择。

原文地址：http://blog.csdn.net/u011300443/article/details/48139555

踩

(0)

评论一句话评论（0）

分享档案

更多>

周排行