标签:
承网上的前辈所言:机器学习不是一个一个孤立的算法堆砌起来的,想要像看《算法导论》这样看机器学习是个不可取的方法.机器学习里面有几个东西一直贯穿全书,比如说数据的分布、最大似然(以及求极值的几个方法,不过这个比较数学了),偏差、方差的权衡,还有特征选择,模型选择,混合模型等等知识,这些知识像砖头、水泥一样构成了机器学习里面的一个个的算法。想要真正学好这些算法,一定要静下心来将这些基础知识弄清楚,才能够真正理解、实现好各种机器学习算法。
学习的资料,大概分这么几个方面:
1.在线课程
台大林轩田老师在coursera上的<机器学习基石>是对学习理论的一个很好的介绍,他在<机器学习技法>中也会在介绍多个常用算法的同时辅以从理论方面的解释,本来这两堂课在台大就是一体的.如果学习机器学习,以此入门,个人认为是首选.
备选的在线课程有吴恩达的课程,较前者更易.
2.教材
书籍方面不建议直接啃周志华教授的<机器学习>(俗称西瓜书,因为大部分篇幅以西瓜分类等问题为背景,因而得名),里面数学挺多,新人的话觉得比较容易迷失在细节里.<机器学习实战>用来入门,个人觉得不错,虽然很多人吐槽其中的代码质量.西瓜书和李航教授的<统计学习方法>可以备在案头,常读常新.国外的经典教材没有读过,不予评价.另外,<集体智慧编程><数据分析实战><人工智能:一种现代方法>皆是拓宽视野不可多得的好书,不要轻易错过.
3.工具软件
边学习边验证,效率更高.有些成熟的机器学习框架,可以让我们在学习中更方便的获得感性的认知.这方面,首推Python系的scikit-learn,易用性不说,文档也感人到不行.备选有Spark中的MLlib以及Mahout,各自优缺点不赘述,一查便明.如果是统计学出身的筒子们,用R或者Matlab当然也是棒棒哒..
4.数学
统计/概率/最优化(凸优化),这里面个个学问深似海,又实在缺不得.奈何人精力有限,对入门者可暂时放缓,集中火力攻一点,先对机器学习的整个知识体系有大概了解,在将数学知识持续补强.机器学习扎根于数学,没有相关储备是走不远的.
5.实战
Kaggle和阿里的天池都可以尝试的玩耍一下,找些简单的玩具题目入手,不求成绩,能够熟悉整个的分析流程,应用上所学就好,想成大牛,慢慢来,比较快.
如果已经工作,尝试在工作中发现应用场景也是不错的,定能让你工作更出彩!
标签:
原文地址:http://www.cnblogs.com/kaggle/p/5666156.html