码迷,mamicode.com
首页 > 其他好文 > 详细

数据仓库技术结构-随便写写

时间:2019-01-04 14:49:53      阅读:154      评论:0      收藏:0      [点我收藏+]

标签:防止   机器   spark   lap   inf   http   flume   redis   png   

 

 

技术分享图片

数据采集:采用Flume收集日志,采用Sqoop将RDBMS以及NoSQL中的数据同步到HDFS上

消息系统:可以加入Kafka防止数据丢失

实时计算:实时计算使用Spark Streaming消费Kafka中收集的日志数据,实时计算结果大多保存在Redis中

机器学习:使用了Spark MLlib提供的机器学习算法

多维分析OLAP:使用Kylin作为OLAP引擎

数据可视化:提供可视化前端页面,方便运营等非开发人员直接查询

数据仓库技术结构-随便写写

标签:防止   机器   spark   lap   inf   http   flume   redis   png   

原文地址:https://www.cnblogs.com/chengjianxiaoxue/p/10219055.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!