搜索关键字：mapreduce topk算法，搜索到4057个结果！码迷,mamicode.com！

认识Hive

认识Hive 从MapReduce到SQL Hive架构三种安装方式 Hive与关系型数据库的区别 1. 认识Hive 前面我们讲到了mapreduce计算框架，各位需要通过java编码的形式来实现设计运算过程，Hive的设计目的就是为了让精通sql技能而java较弱的分析师能够利用hadoop进 ...

分类：其他好文时间：2020-11-21 12:33:40 阅读次数：7

MapReduce

2. MAPREDUCE框架结构及核心运行机制 2.1 框架架构一个完整的mapreduce程序在分布式运行时有三类实例进程：1、MRAppMaster(Mapreduce application master)：负责整个程序的过程调度及状态协调2、MapTask：负责map阶段的整个数据处理流程 ...

分类：其他好文时间：2020-11-21 12:15:54 阅读次数：6

大数据平台建设 —— SQL查询引擎之Presto

大数据查询引擎Presto简介SQLonHadoop：Hive的出现让技术人员可以通过类SQL的方式对批量数据进行查询，而不用开发MapReduce程序MapReduce计算过程中大量的中间结果磁盘落地使运行效率较低为了提高SQLonHadoop的效率，各大工具应运而生，比如Shark、Impala等SQLonHadoop的常见工具：Presto是什么：Presto是由Facebook开发的分布式

分类：数据库时间：2020-11-21 12:01:11 阅读次数：8

深入探讨HBASE

HBase是一个高可靠、高性能、面向列的，主要用于海量结构化和半结构化数据存储的分布式key-value存储系统。它基于Google Bigtable开源实现，但二者有明显的区别：Google Bigtable基于GFS存储，通过MAPREDUCE处理存储的数据，通过chubby处理协同服务；而HB... ...

分类：其他好文时间：2020-11-20 12:05:39 阅读次数：11

漫画：什么是MapReduce？

漫画：什么是MapReduce？点击上方“程序员小灰”，选择“置顶公众号”有趣有内涵的文章第一时间送达！—————第二天—————————————————什么是MapReduce？MapReduce是一种编程模型，其理论来自Google公司发表的三篇论文（MapReduce，BigTable，GFS）之一，主要应用于海量数据的并行计算。MapReduce可以分成Map和Reduce两部分理解。1.

分类：其他好文时间：2020-11-20 11:20:39 阅读次数：5

yarn初始

yarn是什么：旧版本MapReduce中的JobTracker/TaskTracker在可扩展性、内存消耗、可靠性和线程模型方面存在很多问题，需要开发者做很多调整来修复。 Hadoop的开发者对这些问题进行了Bug修复，可是由此带来的成本却越来越高，为了从根本上解决旧MapReduce存在的问题 ...

分类：其他好文时间：2020-11-19 12:56:26 阅读次数：17

本文将大数据学习门槛降到了地平线

可能是Hadoop hdfs mapreduce最亲民的介绍

分类：其他好文时间：2020-10-30 13:03:28 阅读次数：17

Hadoop框架：HDFS高可用环境配置

在单点或者少数节点故障的情况下，集群还可以正常的提供服务，HDFS高可用机制可以通过配置Active/Standby两个NameNodes节点实现在集群中对NameNode的热备来消除单节点故障问题，如果单个节点出现故障，可通过该方式将NameNode快速切换到另外一个节点上。

分类：其他好文时间：2020-10-29 09:35:04 阅读次数：15

启动YARN并运行MapReduce程序（伪分布式模式）

配置集群配置yarn-env.sh Linux系统中获取JDK的安装路径 [xiaoran@hadoop101 hadoop-2.7.2]$ echo $JAVA_HOME /opt/module/jdk1.8.0_144 修改JAVA_HOME路径 [xiaoran@hadoop101 hado ...

分类：其他好文时间：2020-10-27 11:36:17 阅读次数：28

hive小文件处理

先搬个砖：一：Hive是什么 Hive是面向大数据的数据仓库，是一种将SQL转换为mapreduce的工具。二：mapreduce的基本流程及阶段可进行的优化操作（其实有很多不用设置有默认的设置或设置后反而执行时间长，此处做了解，参考设置在下一节）附上网上的一张老图（虽然老但是很具有代表性， ...

分类：其他好文时间：2020-10-16 11:19:02 阅读次数：24

共4057条上一页 1 ... 4 5 6 7 8 ... 406 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)