搜索关键字：mapreduce topk算法，搜索到4057个结果！码迷,mamicode.com！

【转】HBase的MapReduce调用

参考： https://blog.csdn.net/u012848709/article/details/83744699 自己照着搭建了下，顺便把坑也踩了下，项目见云盘：链接：https://pan.baidu.com/s/1A_ZutmadXRIKJhPYxvg_bw 提取码：49l3 ...

分类：其他好文时间：2019-11-30 09:49:27 阅读次数：59

MIT6.824食用过程

MIT6.824食用过程 Lab1 MapReduce 一、介绍本实验使用Go语言构建一个mapreduce库，以及一个容错的分布式系统。第一部分完成一个简单的mapreduce程序，第二部分写一个提交到mapreduce workers 的master 并且要能够处理workers 的错误。库 ...

分类：其他好文时间：2019-11-27 19:07:21 阅读次数：119

初识Spark

Spark(一): 基本架构及原理 Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架，最初在2009年由加州大学伯克利分校的AMPLab开发，并于2010年成为Apache的开源项目之一，与Hadoop和Storm等其他大数据和MapReduce技术相比，Spark有如下 ...

分类：其他好文时间：2019-11-25 11:52:12 阅读次数：62

troubshooting-sqoop 导出 TiDB表数据报com.mysql.jdbc.exceptions.jdbc4.CommunicationsException: Communications link failure

2019-11-22 17:15:27,705 FATAL [IPC Server handler 13 on 44844] org.apache.hadoop.mapred.TaskAttemptListenerImpl: Task: attempt_1574410493054_0011_m_00 ...

分类：数据库时间：2019-11-23 17:52:36 阅读次数：71

云计算与大数据实验：Hbase shell操作成绩表

【实验目的】 1)了解hbase服务 2)学会hbase shell命令操作成绩表【实验原理】 HBase是一个分布式的、面向列的开源数据库，它利用Hadoop HDFS作为其文件存储系统，利用Hadoop MapReduce来处理HBase中的海量数据。本试验中hbase提供了一个shell的终 ...

分类：系统相关时间：2019-11-23 15:54:07 阅读次数：276

Flume和 Sqoop

Sqoop简介 Sqoop是一种旨在有效地在Apache Hadoop和诸如关系数据库等结构化数据存储之间传输大量数据的工具原理: 将导入或导出命令翻译成Mapreduce程序来实现。在翻译出的Mapreduce中主要是对InputFormat和OutputFormat进行定制 RDBMS到HD ...

分类：Web程序时间：2019-11-21 21:27:34 阅读次数：113

hadoop及NameNode和SecondaryNameNode工作机制

hadoop及NameNode和SecondaryNameNode工作机制 1.hadoop组成 Common MapReduce Yarn HDFS （1）HDFS namenode：存放目录，最重要的（主机） datanode：存放数据。（从机） 2namenode：“助手” （2）YARN R ...

分类：其他好文时间：2019-11-21 12:21:17 阅读次数：83

DBInputFormat和DBOutputFormat——悟空智慧教育

为了方便MapReduce直接访问关系型数据库（Mysql,Oracle）， Hadoop提供了DBInputFormat和DBOutputFormat两个类。通过DBInputFormat类把数据库表数据读入到HDFS，根据DBOutputFormat类把MapReduce产生的结果集导入到数据 ...

分类：数据库时间：2019-11-20 21:53:46 阅读次数：83

MapReduce显示最受欢迎的Top10课程（按照课程编号）

上篇博客已经说过，会将代码进行优化，并通过TreeMap进行排序实现，现在简单说明一下代码的思路。项目以上传到github：https://github.com/yandashan/MapReduce_Count2.git 这次的代码是根据课程的id进行排序的，map的流程和普通的WordCoun ...

分类：其他好文时间：2019-11-19 15:39:05 阅读次数：79

理解Spark运行模式（二）(Yarn Cluster)

上一篇说到Spark的yarn client运行模式，它与yarn cluster模式的主要区别就是前者Driver是运行在客户端，后者Driver是运行在yarn集群中。yarn client模式一般用在交互式场景中，比如spark shell, spark sql等程序，但是该模式下运行在客户端 ...

分类：其他好文时间：2019-11-18 22:14:29 阅读次数：101

共4057条上一页 1 ... 29 30 31 32 33 ... 406 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)