现在想学机器学习的同学们好幸福。如下所有书,amazon上都有。首先,入门用周志华的《机器学习》,比较系统全面,中文理解快;进阶用Elements Of Statistical Learning 或者 Pattern Recognition and Machine Learning,后者有人做了翻译免费放出的,可以在网上找,我个人比较喜欢前者,逻辑结构比较清晰;平时快速查找和复习可以用李航的《统计学习方法》。喜欢从视频学习入门的,可以在coursera上看Andrew Ng的Machine Learning或者台湾国立的机器学习基石,后者是中文的,用的很多比喻很贴中国人思维
coursera上的Deeplearning.ai
数据挖掘领域,我不是特别熟悉。但基本不可避免通常都是传统统计学习方法的应用领域。
Logistics Regression,基本是区分菜鸟和逗逼的第一题啦。
Support Vector Machine,基本是区分进阶和菜鸟的第一题啦。
Naive Bayes,离散和连续的差别,可以看出概率基础哟。
Decision Tree,可以看点信息论,然后面试官就对你刮目相看啦。
Expectation Maximization,了解它的应用的模型,不需要背,理解EM就会觉得豁然开朗啦。
Gradient Descent,同上。
Over-fitting,如何避免过拟合?
Regularization,为什么可以避免过拟合?可以参考下病态问题。
Ensemble Learning,数据挖掘最常用的模型了吧,想想为什么集成方法是有效的。
Transfer Learning,貌似现在很火啊(图像识别领域)!!我不是很懂啊~~求懂的大神留言~~为什么由某一领域训练模型可以应用到其他领域?又是如何应用的?