机器学习流行原因---
1) 由人工智能AI发展来的一个领域
2) 是计算机需要开发的一项新的能力,涉及工业和基础学科中的很多内容。
应用学习算法,如设计自主机器人,计算生物学和其他被机器学习影响的领域。
1) 数据挖掘
网站点击流数据、电子医疗记录、计算生物学和工程学。
2) 无法手动进行编程的领域
自动直升机、手写体识别、自然语言处理NLP和计算机视觉。
3) 自我定制程序
Amazon, Netflix(网飞公司)的产品推送。
4) 理解人类的学习(大脑,real AI)
Machine Learning definition
1) Arthur Samuel (1959). Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed.(曾经编写过跳棋程序)
2) Tom Mitchell (1998) Well-posed Learning Problem: A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.
Supervised learning 监督学习
Unsupervised learning 非监督学习
Others: Reinforcement learning增强学习, recommender systems推荐系统.
Supervised Learning :“right answers” given.
给算法一个数据集,并给定每个样本“正确的答案”(标记,正样本和负样本)。
l Regression:Predict continuous valued output (price).回归问题,用来预测连续性输出值。
l Classification:Discrete valued output (0 or 1)
Unsupervised Learning : “right answers” are not given.没有标记正负样本之分。
无监督学习(聚类算法):给定一个训练数据集,从中找到某种结构,即将数据集分为几个聚类。(让算法自己从数据中发现一切)
Cock tail party problem algorithm:[W,s,v] = svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x‘);
原文地址:http://blog.csdn.net/finded/article/details/43413299