标签:
1>监督学习(分类):先让机器学习一下每种花朵的样本数据,然后让他根据这些信息,对未标志出花朵种类的图像进行分类。
2>特征:我们把数据中所有测量的结果都叫特征。
2>交叉验证:极端的叫去一法(leave-one-out)从训练集中拿出一个样本,并在缺少这个样本的数据上训练一个模型,然后看模型是否能够对这个样本正确分类
3>分类模型的组成:
模型结构:采用一个阀值在一个特征上进行划分。
搜素过程:尽可能多的尝试所有特征和阀值的组合。
损失函数:用他来确定哪些可能性不会太差。
4>特征工程(feature engineering):好特征的目标是在重要的地方取值不同,不重要的地方不变。
特征选择(feature selection)
5>最邻近分类:考虑到每个样本是由它的特征所表示的(它是N维空间中的点),我们可以计算样本之间的距离。
6>特征归一单位:归一到Z值(z-score):特征离它的平均值有多远。
7>二类分和多分类
Building Machine Learning Systems with Python 2
标签:
原文地址:http://www.cnblogs.com/michael2016/p/5204128.html