标签:
机器学习的特点
机器学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测和分析的一门学科。其主要特点:
机器学习的对象
机器学习的对象数据。它从数据出发,提取数据的特征,抽象出数据的模型,发现数据的知识,又回到对数据的分析和预测当中去。机器学习关于数据的基本假设是同类数据具有一定的统计规律性,这是机器学习的前提。
机器学习的目的
机器学习的目的是对是数据进行预测和分析,尤其是对未知的新数据进行预测和分析。
机器学习的方法
机器学习可以分为:
机器学习的三要素:
损失函数和风险函数
机器学习中,损失函数用来度量模型一次预测的好坏;风险函数度量平均意义下模型预测的好坏。
损失函数越值小,模型就越好,常见的损失函数有:
风险函数是理论上模型对联合分布的平均意义下的损失,也称为期望风险。实际学习中一般用经验风险(模型关系训练样本集的平均损失)估计期望风险。这里又涉及到两个基本策略:经验风险最小化和结构风险最小化。
训练误差和测试误差
过拟合
过拟合是指模型对已知数据预测的很好,但对未知数据预测很差的现象。
交叉验证
交叉验证的基本想法就是重复的使用数据,把给定的数据进行切分,将切分的数据集组合成训练集和测试集,在此基础上反复地进行训练、测试及模型选择。交叉验证可以分为:
生成模型和判别模型
监督学习方法可以分为生成方法和判别方法,所学到的模型分别成为生成模型和判别模型。
生成方法由数据学习联合概率分布
判别方法由数据直接学习决策函数
标签:
原文地址:http://blog.csdn.net/cahn_2006/article/details/51331424