前言ApacheKylin是一个开源的分布式分析引擎,最初由eBay开发贡献至开源社区。它提供Hadoop之上的SQL查询接口及多维分析(OLAP)能力以支持大规模数据,能够处理TB乃至PB级别的分析任务,能够在亚秒级查询巨大的Hive表,并支持高并发。Kylin的理论基础:空间换时间。Kylin从数..
分类:
Web程序 时间:
2017-03-23 15:05:57
阅读次数:
877
1. impala 实时交互SQL大数据查询工具 它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。 Impala的最大特点也是最大卖点就是它的快速。 Impala完全抛弃了Hive+MapReduce这个不太适合做SQL查询的缓慢范式 通过使用与商用并行关系数据库中 ...
分类:
其他好文 时间:
2017-03-23 11:35:12
阅读次数:
251
一、环境安装:pb编译器的安装 1、从https://github.com/google/protobuf/releases下载protocolBuffer对应版本编译器包,比如目前的对应的objc最新版本Protocol Buffers v3.2.0 2、解压包,假设解压后,打开终端,进入文件夹p ...
分类:
移动开发 时间:
2017-03-22 12:48:49
阅读次数:
278
1016. 部分A+B (15) 正整数A的“DA(为1位整数)部分”定义为由A中所有DA组成的新整数PA。例如:给定A = 3862767,DA = 6,则A的“6部分”PA是66,因为A中有2个6。 现给定A、DA、B、DB,请编写程序计算PA + PB。 输入格式: 输入在一行中依次给出A、D ...
分类:
其他好文 时间:
2017-03-19 15:57:44
阅读次数:
174
阿里云发布了许多产品,今天让我们来了解下大数据计算服务MaxCompute这款产品吧。 什么是MaxCompute呢? MaxCompute是由阿里云自主研发,是阿里巴巴自主研发的海量数据处理平台。提供针对TB/PB级数据、实时性要 ...
分类:
其他好文 时间:
2017-03-17 19:07:05
阅读次数:
204
开源搜索引擎 当前是云计算和数据快速增长的时代,今天的应用程序正以PB级和ZB级的速度生产数据,但人们依然在不停的追求更高更快的性能需求。随着数据的堆积,如何快速有效的搜索这些数据,成为对后端服务的挑战。本文,我们将比较业界两个最流行的开源搜索引擎,Solr和ElasticSearch。两者都建立在 ...
分类:
其他好文 时间:
2017-03-15 12:28:35
阅读次数:
751
1KB=1024B1MB=1024KB1GB=1024MB1TB=1024GB1PB=1024TB1EB=1024PB1ZB=1024EB1YB=1024ZB1BB=1024YB1EB=1099511627776GB,EB和GB的关系,就好像TB和Byte的关系.换句话说,如果一个硬盘容量是500GB的话,那么,要装载一个1EB的文件,需要用掉22亿个这样的硬盘...
分类:
其他好文 时间:
2017-03-11 10:49:05
阅读次数:
175
因为日志的种类比较多,这里记录下来,方便查看! 1 pb下发日志查看 目前已经确定220-224 603都是这么查看的。手工下发的业务应该都是这么查看的,其实只要去确定步骤2中的序号,就可以直接进入步骤4直接确认(记得将2中的序号+1) 1.通过《手工业务》可以查看需要下发业务的模块编码,可以用来确 ...
分类:
其他好文 时间:
2017-03-09 00:08:14
阅读次数:
574
硬编码格式的弊端:数据库发生改变时,要重新修改代码,重新编译和部署 解决方法:将数据库信息写在配置文件当中,让程序通过读取配置文件来获得这些信息 编写配置文件database.properties创建包com.pb.tree.util,编写类ConfigManager 读取属性文件 package ...
分类:
数据库 时间:
2017-03-05 22:52:57
阅读次数:
334
基础介绍分布式文件系统(DistributedFileSystem)是指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连,也就是集群文件系统,可以支持大数量的节点以及PB级的数据存储。常见的分布式文件系统GFS、HDFS、GridFS、mogileFS、TFS、fastDFS..
分类:
其他好文 时间:
2017-03-01 21:30:53
阅读次数:
295