码迷,mamicode.com
首页 >  
搜索关键字:hadoop 性能调优    ( 15126个结果
Hive的基本介绍
什么是Hive? Hive:由Facebook开源用于解决海量结构化日志的数据统计工具。 Hive 是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。 本质是:将SQL转化成MapReduce程序。 1、Hive 处理的数据存储在HDFS; 2、Hiv ...
分类:其他好文   时间:2020-12-03 11:43:46    阅读次数:3
大数据学习(14)—— HBase进阶
HBase读写流程 在网上找了一张图,这个画的比较简单,就拿这个图来说吧。 写流程 1.当Client发起一个Put请求时,首先访问Zookeeper获取hbase:meta表。 2.从hbase:meta表查询即将写入数据的Region位置。 3.Client向目标RegionServer发出写命 ...
分类:其他好文   时间:2020-12-02 12:39:17    阅读次数:7
Linux 系统性能评测基准系统配置及其原理
原创LiamLinux阅码场3月3日概要开发人员在高性能系统的性能调优过程中,经常会碰到各种背景的噪声干扰,从而使得收集的数据不够精确。本文主要从CPU以及Linux操作系统的角度来分析各种噪声的来源以及消除方法。最终的目标是搭建基准平台,在特定的cpu上实现”0”干扰。Cpu运行中存在的几种背景噪声干扰来源1.调度器:进程调度器对于系统的影响几乎无处不在,Linux内核一般来说是使用公平的分时调
分类:系统相关   时间:2020-12-02 12:14:10    阅读次数:8
zookeeper技术介绍[python书籍福利]
zookeeper技术介绍[python书籍福利]Zookeeper技术介绍ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。ZooKeeper的目标就是封装好复杂易出错的关键服务,将简单易用的接口和
分类:编程语言   时间:2020-12-02 11:57:17    阅读次数:3
Cloudera Manager的基本使用
>.ClouderaManager功能 1.1>.管理监控集群主机(主要监控硬件和软件的信息); 1.2>.同一管理配置(主要是针对服务,比如hdfs,hbase等等); 1.3>.管理维护Hadoop平台系统; 2>.ClouderaManager的一些常见名词 2.1>.主机-host 2.2> ...
分类:其他好文   时间:2020-12-01 11:54:36    阅读次数:3
一次看完28个关于ES的性能调优技巧,很赞,值得收藏!
因为总是看到很多同学在说Elasticsearch性能不够好、集群不够稳定,询问关于Elasticsearch的调优,但是每次都是一个个点的单独讲,很多时候都是case by case的解答,本文简单梳理下日常的Elasticsearch使用调优,以下仅为自己日常经验之谈,如有疏漏,还请大家帮忙指正 ...
分类:其他好文   时间:2020-11-27 11:45:01    阅读次数:11
Hadoop框架:MapReduce基本原理和入门案例
MapReduce既是一个编程模型,也是一个计算组件,处理的过程分为两个阶段,Map阶段:负责把任务分解为多个小任务,Reduce负责把多个小任务的处理结果进行汇总。其中Map阶段主要输入是一对Key-Value,经过map计算后输出一对Key-Value值;然后将相同Key合并,形成Key-Value集合;再将这个Key-Value集合转入Reduce阶段,经过计算输出最终Key-Value结果集。
分类:其他好文   时间:2020-11-26 14:53:23    阅读次数:6
计数器
package com.atguigu.etl; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.NullWritable; impo ...
分类:其他好文   时间:2020-11-25 13:04:03    阅读次数:26
大数据组件
1.大数据架构图谱 文件系统 HDFS Hadoop Distributed File System,简称HDFS,是一个分布式文件系统。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。 GlusterFS 是一个集群的文件系统 ...
分类:其他好文   时间:2020-11-25 12:06:50    阅读次数:8
Hadoop全分布模式启动集群
一、 初始化工作: 1. 准备三台机器 hostanme IP 用途 master 192.168.0.10 namenode node1 192.168.0.11 datenode node2 192.168.0.12 datenode 在三台机器上做下面的动作 2. 编辑/etc/hosts 1 ...
分类:其他好文   时间:2020-11-23 12:38:36    阅读次数:12
15126条   上一页 1 ... 14 15 16 17 18 ... 1513 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!