标签:
1. 监督学习(supervised learning):
给定输入样本集,机器可以从中推演出指定目标的可能结果。
一般采用两种类型的目标变量:标称型和数值型。
- 标称型:标称型目标变量的结果只有在有限目标集中取值,如真与假,动物分类集合
{爬行类,鱼类, 哺乳类,两栖类}
- 数值型:数值型目标变量可以在无限数值集合中取值,如 0.001、
42.001、 1000.743 等。数 值型目标变量主要用于回归分析。
2. 无监督学习:数据没有类别信息,不会给定目标值。
- 聚类:无监督学习中,将数据集合分成由类似对象组成的多个类的过程
- 密度估计:将寻找数据统计值的过程称为密度估计
机器学习基础
------------
1. 概念:何为机器学习,将无序的数据转换成有用的信息
2. 数据获取:譬如可以在人们手机上装app,通过许多手机的磁力计得到信息
3. 术语:
- 专家系统
- 属性/特征
- 分类
- 目标变量(类别)
- 训练数据和测试数据
4. 任务:
1. 监督学习(知道预测什么,即目标变量的分类信息)
- 分类:将实例数据划分到合适的分类中,譬如数据拟合曲线
- 回归:主要用于预测数值型数据
2. 无监督学习(数据无类别信息,不给目标值)
- 聚类:数据集合分成类似对象组成的集合
- 密度估计:寻找数据统计值的过程
- 无监督学习还可以减少数据特征的维度,以便我们可以使用二维或三维图形展示数据
5. 开发步骤
1. 收集数据
2. 准备输入数据
3. 分析输入数据
4. 训练算法
5. 测试算法
6. 使用算法
标签:
原文地址:http://www.cnblogs.com/CuriousBull/p/5314862.html