大数据查询引擎Presto简介SQLonHadoop:Hive的出现让技术人员可以通过类SQL的方式对批量数据进行查询,而不用开发MapReduce程序MapReduce计算过程中大量的中间结果磁盘落地使运行效率较低为了提高SQLonHadoop的效率,各大工具应运而生,比如Shark、Impala等SQLonHadoop的常见工具:Presto是什么:Presto是由Facebook开发的分布式
分类:
数据库 时间:
2020-11-21 12:01:11
阅读次数:
8
《1分钟了解区块链的本质》,介绍了什么是区块链,区块链是一个没有管理员,每个节点都拥有全部数据,高可用的分布式存储系统。《1分钟了解挖矿的本质》,介绍了什么是挖矿,挖矿是在最新区块链的数据上,生成一个符合条件的区块,链入区块链的过程。有不少朋友问,全球每个区块链节点都包含全部数据,都在最新的区块链数据上挖符合条件的区块,如何两个节点同时挖到新区块,出现数据不一致,该怎么办呢?今天,花1分钟和大家介
分类:
其他好文 时间:
2020-11-18 12:18:41
阅读次数:
3
上一篇《1分钟了解区块链的本质》,介绍了什么是区块链,区块链是一个没有管理员,每个节点都拥有全部数据,高可用的分布式存储系统。文章的留言里,不少朋友会用比特币来解释区块链,那区块链与比特币是什么关系?答:区块链是分布式存储,比特币是基于该存储的应用,其他诸如莱特币,以太币都是基于区块链的电子货币应用。理论上,使用上层应用来解释底层存储是不合适的。如上图,mysql是底层存储,wechat是上层应用
分类:
其他好文 时间:
2020-11-18 12:18:23
阅读次数:
4
四、pod控制器controller用于控制pod控制器主要分为:ReplicationController(相当于ReplicaSet的老版本,现在建议使用Deployments加ReplicaSet替代RC)ReplicaSet副本集,控制pod扩容,裁减Deployments控制pod升级,回退StatefulSets部署有状态的pod应用DaemonSet运行在所有集群节点(包括maste
分类:
其他好文 时间:
2020-11-11 16:17:53
阅读次数:
8
1.简介 redis-cluster是一种分布式存储的集群,不同主节点上存储不同的数据。 原理请参照: https://www.cnblogs.com/CoreXin/articles/5688019.html https://blog.csdn.net/truelove12358/article/ ...
分类:
其他好文 时间:
2020-11-06 02:36:56
阅读次数:
19
知乎HBase实践前言HBase是一个基于Hadoop面向列的非关系型分布式数据库(NoSQL),设计概念来源于谷歌的BigTable模型,面向实时读写、随机访问大规模数据集的场景,是一个高可靠性、高性能、高伸缩的分布式存储系统,在大数据相关领域应用广泛.HBase系统支持对所存储的数据进行透明切分,从而使得系统的存储以及计算具有良好的水平扩展性.知乎从2017年起开始逐渐采用HBase系统存储各
分类:
其他好文 时间:
2020-11-06 01:07:32
阅读次数:
22
本想试试看,结果却拿到了京东的Offer|文末送书最近,春招已经基本接近尾声了,我找了几位拿到名企Offer的粉丝,请他们总结了面试经验,近期会分批的推送给大家。希望给那些正在准备秋招的同学提供些帮助。今天给大家分享的面经作者通过了2018年的春招,通过了京东的几轮技术面试。以下是他总结的面试经验及准备思路。Hollis只做了简单的格式修改。希望对你有帮助。从年后开始正式准备,在春招抱着试一试的念
分类:
其他好文 时间:
2020-11-01 11:06:36
阅读次数:
22
一、Rook、ceph简介Ceph分布式存储系统Ceph是一种高度可扩展的分布式存储解决方案,提供对象、文件和块存储。在每个存储节点上,您将找到Ceph存储对象的文件系统和CephOSD(对象存储守护程序)进程。在Ceph集群上,您还可以找到CephMON(监控)守护程序,它们确保Ceph集群保持高可用性。RookRook是一个开源的cloud-nativestorage编排,提供平台和框架;为各
分类:
其他好文 时间:
2020-10-24 11:43:42
阅读次数:
23
年薪200w+的大数据架构师领衔直播,以大数据实时数仓项目为中心,延展4大企业级项目+5大AI应用+6大热门专题,助你开启大数据高薪魔盒。课程优势及特色:1、整体架构:仅关注数仓内部细节-->兼顾数据采集、分布式存储、流计算、建模与实时构建、可视化开发端到端的整体解决方案2、数据采集:人肉管理schema-->统一数据采集解决方案:自动系统化管理schema3、流处理:大量流处理job
分类:
其他好文 时间:
2020-10-19 22:51:25
阅读次数:
22