码迷,mamicode.com
首页 > 其他好文 > 详细

CDA数据分析【第二章:数据收集与导入】

时间:2019-10-02 20:44:53      阅读:97      评论:0      收藏:0      [点我收藏+]

标签:特征   init   str   关系   资源库   span   结构化   生命周期   amber   

一.概述

  数据是对我们所研究现象的属性和特征的具体描述,在分析数据前必须要做的工作就是收集数据。按照存储形式可以将数据划分为结构化数据、非结构化数据和半结构化数据。

  1.结构化数据

    能够用数据或统一的格式加以表示,简单来说就是数据库。

  2.非结构化数据

    无法用数据或统一的结构加以表示,如视频、音频、图片、文档等形式。

  3.半结构化数据

    包括邮件、HTML、报表、资源库等。

二.SQL语言和MySQL

  数据库,顾名思义,是存放数据的仓库。严格地讲,数据库是长期存储在计算机内、有组织的、可共享的大量数据的集合。数据库中的数据按一定的数据模型组织、描述和存储,具有较小冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。概况地讲,数据库数据具有永久存储、有组织和可共享三个基本特点。

  1.SQL语言

    SQL【Structured Query Language】,即结构化查询语言,是关系型数据库的标准语言。SQL是在1974年由Boyce和Chamberlin提出的,并在IBM公司研制的数据库管理系统原型System R上实现。于1987年定为国际标准。SQL集数据查询【Data Query】、数据操纵【Data Manipulation】DML、数据定义【Data Definition】DDL和数据控制【Data Control】DCL功能于一身,语言风格统一,可以独立完成数据库生命周期中的全部活动。

未完待续。。。

CDA数据分析【第二章:数据收集与导入】

标签:特征   init   str   关系   资源库   span   结构化   生命周期   amber   

原文地址:https://www.cnblogs.com/yszd/p/11618238.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!