码迷,mamicode.com
首页 > Web开发 > 详细

cube.js预聚合对于大数据量处理的问题

时间:2021-05-24 09:57:40      阅读:0      评论:0      收藏:0      [点我收藏+]

标签:资料   格式   包含   分析   功能   分区   hub   而且   源码   

cube.js 的预聚合是一个很不错的功能,但是目前是有一些问题的,比如我们包含了大量的数据(几十完,上百万)

目前官方相关的解决方法

  • 数据拆分
  • 基于文件模式的文件处理(比如cubestore支持csv格式的)
  • 基于stream模式的数据处理(目前官方也比较推荐的模式)

一些说明

目前方案都不太好,stream 的driver 是有限的(mysql支持),而且目前cube.js 数据预聚合处理需要download查询数据,然后
再写入外部或者源数据的,也是有问题的,rollup 比较推荐同时可以结合基于时间的分区,会很很多。后期会通过源码分析下cube.js
预聚合的实现机制

参考资料

https://github.com/cube-js/cube.js/pull/2740

cube.js预聚合对于大数据量处理的问题

标签:资料   格式   包含   分析   功能   分区   hub   而且   源码   

原文地址:https://www.cnblogs.com/rongfengliang/p/14770481.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!