1. 分类
前两部分主要探讨监督学习(supervisedieaming )
目标变量:标称型和数值型
标称型目标变量的结果只在有限目标集中取值,如真与假、动物分类集合{ 爬行类、鱼类、哺乳类、两栖类、植物、真 菌 } ;数值型目标变量则可以从无限的数值集合中取值,如 0.100、42.001、〗000.743等
前七章主要研究分类算法
机器学习:就是把无序的数据转换成有用的信息
监督学习:分类和回归,知道预测什么,有目标变量的分类信息
1)机器学习的主要任务就是分类。
测试机器学习算法的效果,通常使用两套独立的样本集:训练数据和测试数据
2)另一项任务是回归,它主要用于预测数值型数据
无监督学习:无类别,无目标值
聚类:将数据集合分成由类似的对象组成的多个类的过程
密度估计 :寻找描述数据统计值的过程