首页 > 移动开发 > 详细

#Week8 Advice for applying ML & ML System Design

时间：2020-01-01 23:38:48 阅读：92 评论：0 收藏：0 [点我收藏+]

标签：line spl splay The design apply inline lambda app

一、Evaluating a Learning Algorithm

训练后测试时如果发现模型表现很差，可以有很多种方法去更改：

用更多的训练样本；
减少/增加特征数目；
尝试多项式特征；
增大/减小正则化参数\(\lambda\)。
那么该怎么去选择采用哪种方式呢？
一般将70%的数据作为训练集，30%的数据作为测试集。
先用训练集最小化\(J_{train}(\Theta)\)，得到一组参数值\(\Theta\)；
然后计算测试集误差\(J_{test}(\Theta)\)：
对于线性回归：

对于逻辑回归：

测试集的平均误差（分类错误的比率）：

假设要选择用几次多项式\(d\)去作为假设函数，那么做法就是不断尝试\(d\)，选择一个在测试集上损失最小的\(d\)，以此作为模型泛化能力的衡量。但是这样是有问题的，因为\(d\)相当于是被测试集训练的，再用测试集去测试，很不公平。所以一般将数据集分为3部分：60%训练集、20%交叉验证集、20%测试集：

二、Bias vs. Variance

看图：

正则化和Bias/Variance的关系：

训练集大小与Bias/Variance的关系：

## 三、Error Analysis
Andrew推荐的流程：

## 四、Handling Skewed Data
如果数据集中正负类的数据规模差距过大，只用误差衡量模型是不可靠的，此时需要查准率和召回率两个指标。

如何权衡这两个指标，一般使用\(F1\)得分：
\[F_1=2\frac{PR}{P+R}\]

#Week8 Advice for applying ML & ML System Design

标签：line spl splay The design apply inline lambda app

原文地址：https://www.cnblogs.com/EIMadrigal/p/12130914.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！