数据仓库之数据模型 关于数据仓库的概念,这里不再累赘。先看下面的图(数据仓库建设的7个主要环节): 本文,主要针对第三块数据仓库模型设计来讨论交流,尤其是互联网行业。 一、关于数据仓库数据模型 1. 数据仓库数据模型是指使用实体、属性及其关系对企业运营和逻辑规则进行统一的定义、编码和命名;是业务人员 ...
分类:
其他好文 时间:
2021-04-20 15:42:53
阅读次数:
0
一、大数据演进,从数据仓库到数据中台 第一阶段 21 世纪的第一个 10 年,企业级数据仓库(EDW)从萌芽到蓬勃发展,“IOT”( IBM、Oracle、Teradata)占领了大部分市场,提供数据仓库建设从硬件、软件到实施的整体方案。 这个时代的数据仓库实施不仅需要购买大(中、小)型机,配套商用 ...
分类:
其他好文 时间:
2020-12-19 13:22:30
阅读次数:
18
题目大意: 给定每个工厂的位置x,物品数p,以及搭建仓库的费用c。每个工厂要么花c建仓库,要么将所有物品运到右方有仓库的地方,代价为物品数*距离。最小费用。 n<=1e6 题目解法: 第一次写斜率优化的题解哈哈哈 斜率优化学的好差但每次写都有新收获! (如果没学过斜率优化就不要看这个题解辣 因为本题 ...
分类:
其他好文 时间:
2020-05-10 19:09:32
阅读次数:
52
原文:https://www.jianshu.com/p/4e72b22edf49 1、数据仓库与数据库 数据仓库是数据库概念的升级,和数据库相比,数据仓库要比数据库更加庞大; 数据仓库主要用于分析数据,数据库主要用于捕获数据; 数据仓库主要存储历史数据,数据库存储在线交易数据; 数据仓库的基本元素 ...
分类:
其他好文 时间:
2020-04-21 18:09:21
阅读次数:
49
数据仓库建设中的数据抽取环节,常常需要增量抽取业务库数据。但业务库数据不是一层不变的,会根据时间发生状态变更,那么就需要同步更新变化数据到HIVE中。过去在Oracle上做数据仓库时,可以使用merge的方法合并新老数据。但hive中没有该功能,本文旨在通过sqoop抽取后,自动实现数据合并。 表设 ...
分类:
数据库 时间:
2020-04-07 18:32:57
阅读次数:
99
以前学斜率优化觉得好难 现在莫名觉得简单 (雾) $fee[i]$维护的一个前缀和 $sum[i]$维护的成品的前缀和 $dis[i]$维护$0 i$的距离 易得状态转移方程 $$dp[i] = min(dp[i],dp[j] + fee[i] fee[j] sum[j] (dis[i] dis[j ...
分类:
其他好文 时间:
2019-12-20 14:02:58
阅读次数:
109
https://loj.ac/problem/10189 题目描述 有$N$个工厂建在山上,每个工厂之间有一定的距离,每个工厂有一定的成品和在这个工厂建仓库的代价。成品只能往山脚运,当前$N$有一个仓库,求再建若干个仓库后所有成品运至仓库的最小代价。 思路 由于产品只能从山上往山下运,所以运的必定会 ...
分类:
其他好文 时间:
2019-11-13 22:17:38
阅读次数:
86
前言 纪念一下我做的第二道斜率优化$dp$题,终于自己能把代码敲出来了,然而有很智障的$bug$,把$i$写成$q[i]$,找了半天QAQ。然后写$dp$公式并优化的能力稍微强了一点(自我感觉良好),对于斜率优化$dp$"去尾"的操作理解更深刻了 描述 $1~N$号工厂,第$i$个工厂有$P_{i} ...
分类:
其他好文 时间:
2019-08-23 13:41:04
阅读次数:
85
题意:$1\sim N$ 号工厂,第$i$ 个工厂有$P_i$个成品,第$i$个工厂建立仓库需要$C_i$的费用,该工厂距离第一个工厂的距离为$X_i$,编号小的工厂只能往编号大的工厂搬用成品,每单位成品搬每单位距离需要花费1,问所有成品搬到工厂里面所需的最少费用是多少 分析 设$f[i]$ 为第 ...
分类:
其他好文 时间:
2019-07-29 23:01:20
阅读次数:
114
题目链接:https://www.lydsy.com/JudgeOnline/problem.php?id=1096 一开始想了想费用流,然后被数据范围pass掉了,感觉dp更可行一些。 只想到一个O(n2)的做法,看到式子比较复杂,就感觉像是斜率优化。 dp[i]表示前i个工厂所求的最小费用,则第 ...
分类:
其他好文 时间:
2019-07-04 09:29:36
阅读次数:
93