吴恩达《机器学习》课程总结（19）总结

时间：2018-07-07 20:23:41 阅读：177 评论：0 收藏：0 [点我收藏+]

标签：.com 视角逻辑回归技术分享精确降维应用数据 ocr

(1)涉及到的算法

1.监督学习：线性回归，逻辑回归，神经网络，SVM。

线性回归（下面第三行x₀⁽ⁱ⁾其实是1，可以去掉）

技术分享图片

逻辑回归

技术分享图片

神经网络（写出前向传播即可，反向框架会自动计算）

技术分享图片

SVM

技术分享图片

2.非监督学习：聚类算法(K-mean),降维(PCA)

K-mean

技术分享图片

PCA

技术分享图片

3.异常检测

技术分享图片

4.推荐系统

技术分享图片

(2)策略

1.偏差与方差，正则化

训练误差减去人类最高水平为偏差(欠拟合)，交叉验证集误差减训练误差为方差(过拟合)；

正则化解决方差问题，不对θ₀正则化；

2.学习曲线

全过程观测偏差与方差，所以更全面。

3.误差分析

找到哪种原因造成误差最大，最该花时间的地方。

4.评价方法

尽量使用单一指标评价，准确率不适合类偏斜，用精确度和召回率判定

精确度是预测的视角（预测为正样本中有多少是正样本），召回率是样本视角（正样本有多少被预测到了）

F1=2（PR）/（P+R）

5.数据集的拆分

训练集用于训练模型，，交叉验证集用于筛选模型/调参，测试集用来做最终评价。

6.上限分析

每一步假设输出完全正确时，能提高多少的正确率，提高最高的地方就是最该马上花时间解决的地方。

(3)应用

1.OCR

检测，分割，识别，现在常常不分割了，直接序列化识别。

2.大规模的机器学习

小批量的训练方法以及使用并行计算。

吴恩达《机器学习》课程总结（19）总结

标签：.com 视角逻辑回归技术分享精确降维应用数据 ocr

原文地址：https://www.cnblogs.com/ys99/p/9277721.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行