Jingle bells, jingle bells, jingle all the way. Oh what fun it is to ride in a one-horse open sleigh. 圣诞节到了,圣诞的歌曲洋洒在大街小巷,有着耳熟能详的几首圣诞歌,你能想象,机器学习也能创作圣诞歌吗? 之前多伦多大学有一个项目,利用“神经网络卡拉OK”写出了一首由计算机创作的歌曲,由计算机程序分析上传的照片的视觉组成部分生成,成为了一首颇具圣诞风味的歌曲, 从此,用机器学习算法进行创作成为一种热门的研究,那究竟什么是机器学习呢? Tom Mitchell认为机器学习这门学科所关注的问题是,计算机程序如何随着经验积累自动提高性能,对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,那么我们称这个计算机程序在从经验E学习。第二种定义则是认为机器学习产生于计算机科学,第三种定义是说机器学习是一类从数据中自动发现模式,并基于发现的模式预测未来数据或者在不确定条件下执行某些决策的方法,典型的例子是通过对超市过去两个月甚至什么更长时间某一类产品的销售量来预测这类产品需要什么时候进多少货。 按照行业通用的机器学习可以将其分为三大类,即监督学习、无监督学习、强化学习。 监督学习即从给定的数据集中学习出一个函数,根据函数预测另一个新的数据的结果,数据中的数据是由人标注的,这类常用于分类回归问题,分类问题例如判断是否离网、是否高消费人群、垃圾邮件过滤等,另外一种场景是回归,即预测年龄、预测收入。其基本流程如图所示: