标签:岗位 时代 描述 冗余 数据仓库 监测 预处理 分析师 针对
数据分析与挖掘行业火爆,人才稀缺。本教程基于Python3全程以真实案例驱动,带你科学系统地学习数据分析与挖掘建模领域的科学思维、必会知识、常用工具、完整流程,让你快速胜任数据分析师岗位,逆袭成为数据掘金时代的抢手人才!
1 数据分析流程
狭义数据分析:A 数据获取 -> B 探索分析与可视化
数据分析:A -> B -> C 预处理理论 -> D 分析建模 -> E 模型评估
数据建模与挖掘:C D E
2 数据获取
数据获取方式包括:
数据仓库
监测与抓取
填写、埋点、日志
数据学习网站
2.1 数据仓库
将所有业务数据经汇总处理,构成数据仓库(DW)。
全部数据的记录
数据集市-DM:部分维度与数据的整理
数据库 vs 仓库:
数据库面向业务存储,仓库面向主题存储(主题:较高层次上的对分析对象数据的一个完整并且一致的描述)
数据库针对应用(OLTP),仓库针对分析(OLAP)
数据库组织规范,仓库可能冗余,相对变化大,数据量大
标签:岗位 时代 描述 冗余 数据仓库 监测 预处理 分析师 针对
原文地址:https://www.cnblogs.com/itman123/p/11583666.html