搜索关键字：impala，搜索到252个结果！码迷,mamicode.com！

6大主流开源SQL引擎总结，遥遥领先的是谁？

根据 O’Reilly 2016年数据科学薪资调查显示，SQL 是数据科学领域使用最广泛的语言。大部分项目都需要一些SQL 操作，甚至有一些只需要SQL。本文就带你来了解这些主流的开源SQL引擎！背景介绍本文涵盖了6个开源领导者：Hive、Impala、Spark SQL、Drill、HAWQ 以 ...

分类：数据库时间：2017-04-24 21:20:23 阅读次数：524

大数据学习总结（8）大数据场景

大数据场景一、各种标签查询查询要素：人、事、物、单位查询范围：A范围、B范围、... 查询结果：pic、name、data from 1、痛点：对所有文本皆有实时查询需求2、难点：传统SQL使用WHERE子句匹配LIKE关键词，在庞大的数据字段中搜索某些想要的字，需遍历所有数据页或者索引页，查询 ...

分类：其他好文时间：2017-04-06 21:24:49 阅读次数：204

SQL数据分析概览——Hive、Impala、Spark SQL、Drill、HAWQ 以及Presto+druid

转自infoQ！根据 O’Reilly 2016年数据科学薪资调查显示，SQL 是数据科学领域使用最广泛的语言。大部分项目都需要一些SQL 操作，甚至有一些只需要SQL。本文涵盖了6个开源领导者：Hive、Impala、Spark SQL、Drill、HAWQ 以及Presto，还加上Calci ...

分类：数据库时间：2017-03-27 10:25:22 阅读次数：666

impala 小记

1. impala 实时交互SQL大数据查询工具它提供SQL语义，能查询存储在Hadoop的HDFS和HBase中的PB级大数据。 Impala的最大特点也是最大卖点就是它的快速。 Impala完全抛弃了Hive+MapReduce这个不太适合做SQL查询的缓慢范式通过使用与商用并行关系数据库中 ...

分类：其他好文时间：2017-03-23 11:35:12 阅读次数：251

parquet文件格式——本质上是将多个rows作为一个chunk，同一个chunk里每一个单独的column使用列存储格式，这样获取某一row数据时候不需要跨机器获取

Parquet是Twitter贡献给开源社区的一个列数据存储格式，采用和Dremel相同的文件存储算法，支持树形结构存储和基于列的访问。Cloudera Impala也将使用Parquet作为底层的存储格式。在很多大数据的应用场景下面，比如电信行业，具有一定规则的数据，字段很多，但是每次查询仅仅针对 ...

分类：其他好文时间：2017-03-14 13:14:35 阅读次数：368

基于spark排序的一种更廉价的实现方案-附基于spark的性能测试

排序可以说是很多日志系统的硬指标（如按照时间逆序排序），如果一个大数据系统不能进行排序，基本上是这个系统属于不可用状态，排序算得上是大数据系统的一个“刚需”,无论大数据采用的是hadoop,还是spark，还是impala,hive，总之排序是必不可少的，排序的性能测试也是必不..

分类：编程语言时间：2017-03-12 22:08:16 阅读次数：189

基于spark排序的一种更廉价的实现方案-附基于spark的性能测试

排序可以说是很多日志系统的硬指标（如按照时间逆序排序），如果一个大数据系统不能进行排序，基本上是这个系统属于不可用状态，排序算得上是大数据系统的一个“刚需”,无论大数据采用的是hadoop,还是spark，还是impala,hive，总之排序是必不可少的，排序的性能测试也是必不可少的。有着计算奥运 ...

分类：编程语言时间：2017-03-12 16:34:23 阅读次数：205

数据分析文章待读

《实时分析系统(HIVE/HBASE/IMPALA)浅析》《MPP DB 是大数据实时分析系统未来的选择吗？》《一套数据，多种引擎（impala/Hive/kylin）》《一套数据，多种引擎续两种数据格式（Parquet/ORCfile）浅析》有兴趣可以看看。 ...

分类：其他好文时间：2017-03-01 18:13:03 阅读次数：173

Hive分区和桶的概念

Hive 已是目前业界最为通用、廉价的构建大数据时代数据仓库的解决方案了，虽然也有 Impala 等后起之秀，但目前从功能、稳定性等方面来说，Hive 的地位尚不可撼动。其实这篇博文主要是想聊聊 SMB join 的，Join 是整个 MR/Hive 最为核心的部分之一，是每个Hadoop/Hiv ...

分类：其他好文时间：2017-02-22 16:31:39 阅读次数：314

Phoenix和SQuirrel安装详解

Phoenix安装详解描述现有hbase的查询工具有很多如：Hive，Tez，Impala，Shark/Spark，Phoenix等。今天的主角是Phoenix。 phoenix，中文译为“凤凰”，很美的名字。Phoenix是由saleforce.com开源的一个项目，后又捐给了Apache基金 ...

分类：其他好文时间：2017-02-14 16:02:38 阅读次数：589

共252条上一页 1 ... 12 13 14 15 16 ... 26 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)