来到公司已经参与开发了一段时间的BI项目,但是仅仅是按照需求开发,今天下午公司给大家培训数据仓库的知识,老大(女程序员)在上面讲,我们在下面听,2到3个小时吧,什么纬度,主题,几乎听的一脸茫然,最后演示了基于BI的成本分析系统,感觉好复杂,主要是对于医疗项目的业务,反正挺繁琐的。做这个项目的目的主要...
分类:
其他好文 时间:
2014-07-06 17:24:53
阅读次数:
193
Greenplum主要组件包括:Master、Segments、Interconnect;其他组件包括ETL Server、Greenplum command center等。0. 组件之-Master:master功能master也是一个gp的独立的数据库,是gp的入口,负责接受和管理客户端的连接...
分类:
其他好文 时间:
2014-07-01 16:57:59
阅读次数:
411
如何梳理BI技术框架? 首先,我们需要从各个菜市场(数据源)挑选我们需要的蔬菜、肉类、水果,然后我们开始挑拣、清洗,并根据菜式的要求,将各种原材料切好(ETL),摆放到厨房(数据仓库);然后厨师根据不同的菜式及口味,将原材料进行必要的搭配(OLAP),最后辅以调料,通过炒、焖、炖等不同烹饪的手法制....
分类:
其他好文 时间:
2014-06-28 11:17:17
阅读次数:
422
1.ETL:数据抽取2.抽取数据在不同的数据源之间,把数据进行转化,加载,清洗操作,保证抽取的数据合法。3.开源实现:Kettle 工具====================================================================学习:大家可以学学这个Ket...
分类:
其他好文 时间:
2014-06-26 13:05:42
阅读次数:
210
写在前面一:
数据仓库ETL工具有很多,基于大数据环境下的分析,Hive用的多些。本文介绍国外的 一款开源ETL工具——Kettle。
写在前面二:
所用软件说明:
一、什么是Kettle
Kettle是一款国外开源的ETL工具,纯java编写,绿色无需安装,数据抽取高效稳定(数据迁移工具)。Kettle中有两种脚本文件,transformation和job,transf...
分类:
其他好文 时间:
2014-06-22 12:01:20
阅读次数:
619
Paper:ImageNet Classification with Deep Convolutional Neual NetworkAchievements:The model addressed by Alex etl.achieved top-1 and top-5 test error ra...
分类:
Web程序 时间:
2014-06-15 12:22:10
阅读次数:
320
1.vertica概念
面向数据分析的数据仓库系统解决方案
2.vertica关键特性
Ø 标准的SQL接口:可以利用已有的BI、ETL、Hadoop/MapReduce和OLTP环境
Ø 高可用:内置的冗余也提升了查询速度
Ø 自动化数据库设计:数据库自动安装、优化、管理
Ø 高级压缩:十多种压缩算法最多可节省90%的空间
Ø 大规模并行处理:运行于低成本的x86型Lin...
分类:
其他好文 时间:
2014-06-02 23:09:24
阅读次数:
483
Paper:
ImageNet Classification with Deep Convolutional Neual Network
Achievements:
The model addressed by Alex etl.
achieved top-1 and top-5 test error rate of
37.5% and
17.0% of classifyin...
分类:
Web程序 时间:
2014-06-02 15:08:24
阅读次数:
369
最近使用hive做一些etl工作,除了日常sql的编写,了解hadoop及hive的一些底层原理性质的东西包括调优非常有必要,一次hive调优就把原来的零散文件做了合并。首先记下hadoop常用的命令:(hadoop
fs -help列出全部)1,hadoop fs –fs [local | ]:声...
分类:
其他好文 时间:
2014-05-26 20:44:49
阅读次数:
308
今天准备在 @zhangkai05
写的小工具model_sql基础上,进一步完善功能,使其更加自动化。方便建模人员开发etl任务。源代码更改后 ,会发布到
git(url地址)上,逐步完善。描述现状及问题团队 数据仓库建模在2013年下开始使用 oracle sql developser data...
分类:
数据库 时间:
2014-05-20 08:08:37
阅读次数:
643