码迷,mamicode.com
首页 >  
搜索关键字:cloudera    ( 675个结果
大数据第一阶段
1 Hadoop是什么1.hadoop是一个由Apache基金会所开发的分布式系统基础架构。2.主要解决,海量数据的储存和海量数据的分析计算问题。3.广义来说,hadoop通常是指一个更广泛的概念 Hadoop生态圈。 Hadoop三大发行版本Hadoop三大发行版本:Apache、Cloudera ...
分类:其他好文   时间:2020-07-26 23:10:55    阅读次数:101
hadoop框架hdfs、mapreduce、yarn三大组件内容
Hadoop是什么?1.hadoop是一个由Apache基金会所开发的分布式系统基础架构。2.主要解决,海量数据的储存和海量数据的分析计算问题。3.广义来说,hadoop通常是指一个更广泛的概念 Hadoop生态圈。 Hadoop三大发行版本Hadoop三大发行版本:Apache、Cloudera、 ...
分类:其他好文   时间:2020-07-26 22:58:58    阅读次数:69
Flume基础(一):概述
1 Flume 定义 Flume 是 Cloudera 提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。Flume 基于流式架构,灵活简单。 2 Flume 组成架构 Flume 组成架构如图 1-1,图 1-2 所示: 2.1 Agent Agent 是一个 JVM 进程,它 ...
分类:Web程序   时间:2020-07-26 02:04:24    阅读次数:109
CDH之service_monitor请求超时问题
CDH 运行一段时间就提示:请求 Service Monitor 超时。这可能会导致页面响应缓慢。请查看 Service Monitor 的状态。 此类问题,是由于相关monitor服务的jvm配置太小导致,随着cloudera的业务量加大,垃圾回收内容增多等原因导致过载,稳定性直接受影响甚至服务进 ...
分类:其他好文   时间:2020-07-13 11:16:38    阅读次数:100
Hadoop基础(二):从Hadoop框架讨论大数据生态
1 Hadoop是什么 2 Hadoop三大发行版本 Hadoop三大发行版本:Apache、Cloudera、Hortonworks。 Apache版本最原始(最基础)的版本,对于入门学习最好。 Cloudera在大型互联网企业中用的较多。 Hortonworks文档较好。 Apache Hado ...
分类:其他好文   时间:2020-07-12 00:59:06    阅读次数:92
maven仓库支持cdh版本配置
目前maven仓库中没有支持cdh的相关依赖。cloudera自己建立了一个相关的仓库。要想利用maven添加相关依赖,则必须单独添加cloudera仓库。 一、项目pom.xml, 添加仓库配置 <repositories> <repository> <id>cloudera</id> <url> ...
分类:其他好文   时间:2020-07-04 22:45:15    阅读次数:129
Flume(一)【概述】
一.Flume定义 ? Flume是Cloudera公司提供的一个高可用、高可靠、分布式的海量日志采集、聚合和传输的系统。Flume基于流式架构,灵活简单。 ? Flume最主要的作用就是,实时读取服务器的本地磁盘的数据,将数据写入到HDFS。 二.Flume基础架构 ? Flume基本组成架构如下 ...
分类:Web程序   时间:2020-07-03 23:51:14    阅读次数:112
Hive llap服务安装说明及测试(二)
Running LLAP as a YARN Service 因为 Apache Slider 已经不维护了,下面介绍 不使用 Slider 的 LLAP使用方式。 参考: https://blog.cloudera.com/apache-hive-llap-as-a-yarn-service/ 将 ...
分类:其他好文   时间:2020-06-28 12:39:20    阅读次数:108
Hive、Spark SQL、Impala比较
Hive、Spark SQL和Impala三种分布式SQL查询引擎都是SQL-on-Hadoop解决方案,但又各有特点。前面已经讨论了Hive和Impala,本节先介绍一下SparkSQL,然后从功能、架构、使用场景几个角度比较这三款产品的异同,最后附上分别由cloudera公司和SAS公司出示的关 ...
分类:数据库   时间:2020-06-25 21:29:31    阅读次数:581
hadoop
Hadoop 分布式系统基础结构 海量数据存储,海量数据计算 Hadoop指的是Hadoop生态圈 Google=》Hadoop GFS->HDFS Map-Reduce->MR BigTable->HBase Hadoop发行版本 Apache:最基础 Cloudera:大型互联网企业 Horto ...
分类:其他好文   时间:2020-06-21 23:10:42    阅读次数:63
675条   上一页 1 2 3 4 ... 68 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!