ApacheRanger简介ApacheRanger提供一个集中式安全管理框架,并解决授权和审计。它可以对Hadoop生态的组件如HDFS、Yarn、Hive、Hbase等进行细粒度的数据访问控制。通过操作Ranger控制台,管理员可以轻松的通过配置策略来控制用户访问权限。Ranger优点:丰富的组件支持(HDFS,HBASE,HIVE,YARN,KAFKA,STORM)提供了细粒度级权限控制(h
分类:
其他好文 时间:
2020-11-18 13:10:32
阅读次数:
10
Hadoop/Hive自带权限控制集群安全下需求:支持多组件,最好能支持当前大数据技术栈的主要组件,HDFS、HBASE、HIVE、YARN、KAFKA等支持细粒度的权限控制,可以达到HIVE列,HDFS目录,HBASE列,YARN队列开源,社区活跃,按照现有的集群情况改动尽可能的小,而且要符合业界的趋势。现有方案:Hadoop、Hive本身的权限控制Kerberos安全认证ApacheRange
分类:
其他好文 时间:
2020-11-18 12:15:31
阅读次数:
8
Hive Join优化以及Hive Join的几个重要特点,在实际使用时也可以利用下列特点做相应优化 ...
分类:
其他好文 时间:
2020-11-17 12:55:26
阅读次数:
18
12个行业月均阅读超100亿,看Spark如何助力微博Feed算法提升活跃度#编者按:本文由高可用架构向黄波约稿,介绍黄波在SparkSummitChina2016中的演讲精华,并侧重对微博系统和Feed系统进行了更多的介绍。黄波,2010年加入新浪微博,微博研发中心Feed技术专家,负责微博Feed流排序和推荐相关项目。目前专注于基于Spark、Storm等计算平台的大数据处理,致力于将分布式计
分类:
编程语言 时间:
2020-11-16 13:06:48
阅读次数:
9
1.环境的安装与准备 参考下图: 2.数据库服务的安装与添加(HADOOP,HDFS,HIVE) 如下图所示: 3.华为官网的文档的指导手册(HADOOP,HDFS,HIVE) FusionInsight HD 6.5.1 应用开发指南 03 https://support.huawei.com/e ...
分类:
数据库 时间:
2020-11-13 12:11:51
阅读次数:
18
在hive的日常使用中,经常需要将hive表中的数据导出来,虽然hive提供了多种导出方式,但是面对不同的数据量、不同的需求,如果随意就使用某种导出方式,可能会导致导出时间过长,导出的结果不满足需求,甚至造成集群资源不必要的浪费。因此本文主要对hive支持的几种导出方式的使用进行整理,并给出每种导出 ...
分类:
其他好文 时间:
2020-11-07 17:31:45
阅读次数:
24
-- 查询具体表的分区目录 select t1.NAME, t2.TBL_NAME,t4.PART_NAME, t3.LOCATION from DBS t1, TBLS t2 , SDS t3 ,PARTITIONSt4 where t1.DB_ID=t2.DB_ID and t4.SD_ID = ...
分类:
其他好文 时间:
2020-11-01 21:29:48
阅读次数:
24
小伙伴们好,俗话说:工欲善其事必先利其器,hive是我们与大数据打交道的工具,所以我们需要熟练使用hive的一些函数,这样后面的数据测试就得心应手啦。
分类:
其他好文 时间:
2020-11-01 21:12:19
阅读次数:
17
如果说大数据里面hive是屠龙刀,那么pandas则是倚天剑,**帮助我们对数据数据挖掘、数据分析、数据清洗**
分类:
其他好文 时间:
2020-11-01 21:11:55
阅读次数:
20
前两天试了下 Flink SQL 写 Hive,对 Sink 部分写数据到 HDFS 的部分比较疑惑,特别是基于 checkpoint 的文件提交,所以看了下 StreamingFileSink 的源码(Flink SQL 写 hive 复用了这部分代码) StreamingFileSink 是 1 ...
分类:
其他好文 时间:
2020-11-01 20:49:03
阅读次数:
18