标签:数据分析 src 爬虫 技术 tar 作者 取数据 机器学习 targe
转载:自己学习使用
python语言
推荐看廖雪峰的python3教程。
数据分析python基础
如list,tuple,dic,set等。我之后的博客会写到。
python爬虫
推荐一本书:《Python网络数据采集》(web Scraping with Python) Ryan Mitchell 写的,非常好。读完这本书+实战几次爬虫你就算熟练了。我之后写的爬虫博客也会以读这本书时的读书笔记来写。
实战推荐崔庆才的博客,也可以看我之后写的爬虫实战博客,我是按照他大框架来进行学习的。
数据的IO,EXCEL,CSV,JSON,SQL数据库。HDF5等。
Numpy数组
Pandas 数据分析
Scipy 矩阵
Matplotlib 数据可视化
这一部分推荐看《Python数据分析》(Python Data Analysis)Lvan Idris写的。
对采集来或现成的数据进行预处理,数据清洗(推荐看《干净的数据=Clean data:数据清洗入门与实践》作者:Megan Squire),数据集成,数据变换,数据规约等。这一部分有兴趣可以看一本书 《Python数据分析与挖掘实战》。这本书看个框架就行。其实写的不咋的。浪费了我好久时间。
学习各种机器学习,数据分析算法。
算法原理推荐看《数据挖掘十大算法》作者:Xindong Wu,Vipin Kumar
python实现推荐看《Python数据分析与挖掘实战》+《Python数据分析》+《机器学习实战》
再往深就是深度学习,神经网络。
学习每一个都需要付出很大量时间,精力与努力。希望你是真的对数据挖掘,数据分析有兴趣。
标签:数据分析 src 爬虫 技术 tar 作者 取数据 机器学习 targe
原文地址:http://www.cnblogs.com/imfan/p/7911494.html