码迷,mamicode.com
首页 >  
搜索关键字:数据仓库    ( 1540个结果
数据仓库之数据模型
数据仓库之数据模型 关于数据仓库的概念,这里不再累赘。先看下面的图(数据仓库建设的7个主要环节): 本文,主要针对第三块数据仓库模型设计来讨论交流,尤其是互联网行业。 一、关于数据仓库数据模型 1. 数据仓库数据模型是指使用实体、属性及其关系对企业运营和逻辑规则进行统一的定义、编码和命名;是业务人员 ...
分类:其他好文   时间:2021-04-20 15:42:53    阅读次数:0
greenplum,teradata,presto,clickhouse四种分布式数据库的对比【转】
1. 四种数据库的比较 数据库描述 Greenplum 开源大规模并行数据分析引擎。借助MPP架构,在大型数据集上执行复杂SQL分析的速度比很多解决方案都要快。应用广泛。 Teradata 大型数据仓库系统,产品成熟,价格昂贵。用于证券系统。 Presto 分布式SQL查询引擎, 专门进行高速、实时 ...
分类:数据库   时间:2021-04-05 12:00:18    阅读次数:0
Kimabll数仓架构下如何确定模型落地哪些表
提出问题?如果要你建立数据仓库,你如何确定数据仓库核心结构中要设计哪些表?以及表结构如何设计?下面通过问答的形势逐个解释。 Kimball模型设计过程: 1、 选定业务过程-依托业务流程 2、 确定粒度 3、 确定维度 4、 确定事实 问题1:如何确定仓库具有哪些维度表? 回答: 以有报表 业务人员 ...
分类:其他好文   时间:2021-02-26 12:58:25    阅读次数:0
一篇文章了解Hbase和Hive
##Hbase和Hive Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。HBase是Hadoop的数据库,一个分布式、可扩展、大数据的存储。单个的从字面意思上或许很难看出二者的 ...
分类:其他好文   时间:2021-02-19 12:52:56    阅读次数:0
[数据仓库]数仓概念合集
数仓分层 虽然作为数据分析或者商业分析师并不需要去做数据仓库,但在企业实际工作中,或多或少,还是需要接触或对接数仓部门,如提出需求、了解相关表的字段含义等,所以今天我们就简单说下数据分析师需要了解的 数据仓库基础知识。 ODS层 / 贴源层 DW层(Data Warehouse) 数据明细层:DWD ...
分类:其他好文   时间:2021-01-13 11:15:23    阅读次数:0
网站用户行为分析
网站用户行为分析 步骤 1.1 本地数据集上传到数据仓库Hive 数据集下载与查看 数据集预处理 把数据集导入HDFS中 在Hive上创建数据库 1.2 Hive数据分析 给出数据分析需求 用select语句实现数据分析 数据分析结果查看与保存 1.3 Hive、MySQL、HBase数据互导 操作 ...
分类:Web程序   时间:2021-01-02 11:41:47    阅读次数:0
网站用户行为分析
网站用户行为分析 步骤 1.1 本地数据集上传到数据仓库Hive 数据集下载与查看 数据集预处理 把数据集导入HDFS中 在Hive上创建数据库 1.2 Hive数据分析 给出数据分析需求 用select语句实现数据分析 数据分析结果查看与保存 1.3 Hive、MySQL、HBase数据互导 操作 ...
分类:Web程序   时间:2020-12-31 12:08:34    阅读次数:0
从数仓到数据中台,谈技术选型最优解
一、大数据演进,从数据仓库到数据中台 第一阶段 21 世纪的第一个 10 年,企业级数据仓库(EDW)从萌芽到蓬勃发展,“IOT”( IBM、Oracle、Teradata)占领了大部分市场,提供数据仓库建设从硬件、软件到实施的整体方案。 这个时代的数据仓库实施不仅需要购买大(中、小)型机,配套商用 ...
分类:其他好文   时间:2020-12-19 13:22:30    阅读次数:18
基于Promethues与Grafana的Greenplum分布式数据库监控的实现
基于Promethues与Grafana的Greenplum分布式数据库监控的实现标签(空格分隔):greenplum系列[toc]一:前言Greenplum是面向数据仓库应用的分布式关系型MPP数据库,基于PostgreSQL开发,跟PostgreSQL的兼容性非常好,大部分PostgreSQL客户端工具及PostgreSQL应用都能运行在Greenplum平台上。GPCC是Greenplum数
分类:数据库   时间:2020-12-07 12:48:36    阅读次数:14
Hive的基本介绍
什么是Hive? Hive:由Facebook开源用于解决海量结构化日志的数据统计工具。 Hive 是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。 本质是:将SQL转化成MapReduce程序。 1、Hive 处理的数据存储在HDFS; 2、Hiv ...
分类:其他好文   时间:2020-12-03 11:43:46    阅读次数:3
1540条   上一页 1 2 3 4 ... 154 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!