标签:rod 通用 ogr size one ons 评分 blog pad
博客已经迁移至Marcovaldo’s blog (http://marcovaldong.github.io/)
Andrew Ng的Machine Learning比較简单,已经看完。林田轩的机器学习基石很多其它的是从概率论的角度来介绍机器学习,之前的视频已经听了大半。但好多都是模棱两可。
如今从头開始,认真整理笔记。笔记的结构遵从课程视频的结构。
以下是机器学习基石的第一讲:the learning problem
机器学习是一门理论和实践相结合的课程。
这门课程从基础入手,介绍机器学习的一些核心理论、核心技巧和实际应用。林田轩老师说要像讲故事一样来讲机器学习,实际上呢还是包括非常多非常难的推导,而作业实在是太难,且网上又找不到答案參考,实在痛苦。
这一小节介绍了整个课程的脉络。例如以下:
(illustrative + technical)
(theoretical + illustrative)
(practical + theroetical)
首先,我们说人的学习(learning)是从观察出发,经过大脑的理解思考等活动。终于转化为我们掌握了的知识技能。而机器学习则是将数据输入给计算机。然后计算机经过一系列的计算处理过程,终于输出我们想要的一些数据。比如我们将近十年的股票数据输入到计算机。计算机经过分析计算等机器学习过程,输入给我们一些数据,而这些数据可以指导我们更好得去炒股。
我们通过一个树木识别的样例来引出为什么要使用机器学习。依照常规的方法,我们非常难通过写一段程序来识别一张图片中的事物是不是树。而机器学习则是通过分析已有的数据,然后自己“学会”怎么推断是不是树。以下给出几种适合使用机器学习的领域:
以下是机器学习的三个要素。有了这三个要素才适合使用机器学习。
最后是本小节的一道測试题:
这一小节给出了机器学习在食、衣、住、行、教育、娱乐六个方面的应用。
最后是本节小測试:
这一小节使用信贷发放系统的样例来继续介绍机器学习,信贷发放系统依据银行已有的客户信息来决定要不要发给顾客信用卡。
首先我们来定义一些变量,这些变量在机器学习中是通用的。用x来表示输入,这里是用户的信息,用y来表示输出。这里是终于要不要发放信用卡(发放的
目标函数(target function)f,其为从输入x到输出y的一个映射。可以百分百准确地解决这个问题,在这里就是能不能准确的推断要不要给某用户发放信用卡。机器学习用到的数据data是银行已有的信用卡发放的资料。hypothesis则是我们通过data训练得到的一个东西,用g来表示,我们希望它可以特别接近f。从而可以准确的处理未知信息。
下图给出了机器学习的流程图。
须要注意的是。目标函数f是未知的。是我们的目标,其能百分百解决我们的问题。g是我们最后实际得到的,与f存在差距。
存在一个集合,里面包括大量的hypothesis。机器学习算法的任务就是从这个集合中找到最好的一个hypothesis,“最好”的标准我们会在以后的课程中给出。
最后给出了机器学习的一个定义:use data to compute hypothesis g that approximates target g。
本节小測试:
这一小节介绍机器学习与其它领域的区别。
首先是机器学习与数据挖掘(data mining)的区别。
整体来说,二者非常难区分彼此。
接下来是机器学习与人工智能(Artificial Intelligent)。应该说。机器学习是实现人工智能的一种方法。
然后是机器学习与统计学(statistics)。
应该说。统计学是机器学习得以实现的一个数学基础。
最后是本小节问题:
机器学习基石第一讲:the learning problem
标签:rod 通用 ogr size one ons 评分 blog pad
原文地址:http://www.cnblogs.com/cxchanpin/p/7294380.html