机器学习,致力于如何通过计算的手段,利用经验来改善自身的性能。在计算机系统中,“经验”通常以“数据”形式存在,因此,机器学习所研究的主要内容,是关于在计算机上从数据中产生“模型”的算法。有了学习算法,我们把经验提供给它,它就能基于这些数据产生模型;在面对新的情况时(例如看到一个没剥开的西瓜),模型会给我们提供相应的判断(例如好瓜)。
[Mitchell ,1997]形式化的定义:假设用P来评估计算机程序在某任务类T上的性能,若一个程序通过利用经验E在T中任务上获得了性能改善,则我们就说关于T和P,则程序对E进行了学习。