标签:生态 style 结果 产生 mdx 语句 仓库 数据库服务 生态系统
大家都知道,数据分析师一门比较高深的学问,并且对于各行各业都有一个很大的帮助。但是大家知道不知道数据分析的数据架构知识呢?数据架构的知识有很多,下面就由小编为大家解答一下这个问题,希望这篇文章能够给大家带来帮助。
就目前而言,很多的数据分析工作都是做的是隐藏工作,说白了就是隐藏在业务系统背后,但是具有非常重要的作用,数据分析的结果对决策、对业务发展有着举足轻重的作用。就目前而言,数据分析的工作已经开始越来越流行了。数据挖掘、数据探索等专有名词的曝光度越来越高,但是在大数据分析系统大行其道之前,数据分析工作已经历了长足的发展,尤其是以BI系统为主的数据分析,已经有了非常成熟和稳定的技术方案和生态系统。在BI系统里面,核心的模块是Cube。Cube是一个更高层的业务模型抽象,在Cube之上可以进行多种操作,而大部分BI系统都基于关系型数据库,而关系型数据库使用SQL语句进行操作,但是SQL在多维操作和分析的表示能力上相对较弱,所以Cube有自己独有的查询语言MDX。BI系统更多以分析业务数据产生的密度高、价值高的结构化数据为主,对于非结构化和半结构化数据的处理非常乏力。例如图片、文本、音频的存储、分析。
而MDX表达式具有更强的多维表现能力,因此以Cube为核心的分析系统基本占据着数据统计分析的半壁江山,大多数的数据库服务厂商直接提供BI套装软件服务,轻易便可搭建出一套OLAP分析系统,不过BI的问题也随着时间的推移逐渐暴露出来。由于数据仓库为结构化存储,当数据从其它系统进入数据仓库这个东西,我们通常叫做ETL过程,ETL动作和业务进行了强绑定,通常需要一个专门的ETL团队去和业务做衔接,决定如何进行数据的清洗和转换。随着异构数据源的增加,例如如果存在视频、文本、图片等数据源,要解析数据内容进入数据仓库,则需要非常复杂的ETL程序,从而导致ETL变得过于庞大和臃肿。
通过这篇文章我们已经知道了数据分析的架构知识的详细解释了,但是这些内容还不能够完整的说出数据分析结构的知识,我们在下一篇文章为大家更加深入的解答一下这个问题。
标签:生态 style 结果 产生 mdx 语句 仓库 数据库服务 生态系统
原文地址:https://www.cnblogs.com/CDA-JG/p/10177871.html