Building Machine Learning Systems with Python 2

时间：2016-02-20 22:51:34 阅读：167 评论：0 收藏：0 [点我收藏+]

标签：

1>监督学习（分类）：先让机器学习一下每种花朵的样本数据，然后让他根据这些信息，对未标志出花朵种类的图像进行分类。

2>特征：我们把数据中所有测量的结果都叫特征。

2>交叉验证：极端的叫去一法（leave-one-out）从训练集中拿出一个样本，并在缺少这个样本的数据上训练一个模型，然后看模型是否能够对这个样本正确分类

3>分类模型的组成：

　　模型结构：采用一个阀值在一个特征上进行划分。

　　搜素过程：尽可能多的尝试所有特征和阀值的组合。

　　损失函数：用他来确定哪些可能性不会太差。

4>特征工程（feature engineering）:好特征的目标是在重要的地方取值不同，不重要的地方不变。

　　特征选择（feature selection）

5>最邻近分类：考虑到每个样本是由它的特征所表示的（它是N维空间中的点），我们可以计算样本之间的距离。

6>特征归一单位：归一到Z值（z-score）:特征离它的平均值有多远。

7>二类分和多分类

标签：

原文地址：http://www.cnblogs.com/michael2016/p/5204128.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

周排行