码迷,mamicode.com
首页 > 其他好文 > 详细

数据分析学习方向(二)

时间:2018-12-27 18:21:59      阅读:117      评论:0      收藏:0      [点我收藏+]

标签:知识   python   数据存储   提升   还需   部分   进阶   元组   bubuko   

技术分享图片

我们在上一篇文章中简单地介绍了数据分析的知识,数据分析知识主要分为5个模块,分别是数据获取、数据存储与提取、数据预处理、数据分析、数据可视化。不同模块的内容难易也是不一样的,下面我们就开始给大家详细讲解一下数据分析其他方面的知识。

首先给大家说说数据获取的知识,一般来说,数据获取的方式有两种,第一种就是公开数据,第二种就是通过Python爬虫获取数据。而外部数据的获取方式也有很多,比如获取外部的公开数据集,一些科研机构、企业、政府会开放一些数据,这就需要大家到特定的网站去下载这些数据。这些数据集通常比较完善、质量相对较高。当然我们也可以通过爬虫来获取信息。在学习爬虫之前需要我们先了解一些 Python 的基础知识:元素(列表、字典、元组等)、变量、循环、函数等等知识,当然我们还需要学会如何用 Python 库实现网页爬虫。

然后我们给大家讲讲数据存取。要想做好数据存取需要学习SQL语言。一般来说,在应对万以内的数据的时候,Excel对于一般的分析没有问题,一旦数据量大,就会力不从心,数据库就能够很好地解决这个问题。而且大多数的企业,都会以SQL的形式来存储数据,如果你是一个分析师,也至少要懂得SQL的操作,能够查询、提取公司的数据。SQL作为最经典的数据库工具,为海量数据的存储与管理提供可能,并且使数据的提取的效率大大提升。一般来说企业数据库里的数据一定是大而繁复的,如果我们提取需要的部分数据使用Excel是不行的,但是SQL可以通过简单的命令帮我们完成这些工作。这就需要我们记住数据库的增、删、查、改的具体操作。这些是数据库最基本的操作。

而数据的分组聚合、如何建立多个表之间的联系是我们需要注意的事情。这个部分是SQL的进阶操作,多个表之间的关联,在我们处理多维度、多个数据集的时候非常有用,这也让你可以去处理更复杂的数据。

数据分析工作中的数据提取以及数据获取是十分重要的步骤,这就需要我们重视起这两个工作,这样才能够为后面的数据分析工作做好基础工作,希望这篇文章能够给大家带来帮助,由于篇幅原因小编就给大家介绍到这里了,我们会在下一篇文章中继续给大家介绍更多的知识。最后感谢大家花时间读完我们的文章。

 

数据分析学习方向(二)

标签:知识   python   数据存储   提升   还需   部分   进阶   元组   bubuko   

原文地址:https://www.cnblogs.com/CDA-JG/p/10185219.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!