今天学习了大数据的一些基本的概念。 什么是Hadoop: 大数据主要还是解决海量数据的存储和海量数据的分析计算。 大数据的特点:大量、高效、多样(结构化数据和非结构化数据)、低价值密度。 Hadoop的三大发行版本: Apache、cloundera、hortonworks。 当然现在clounde ...
分类:
其他好文 时间:
2021-07-09 17:52:26
阅读次数:
0
1 Hadoop是什么 2 Hadoop三大发行版本 Hadoop三大发行版本:Apache、Cloudera、Hortonworks。 Apache版本最原始(最基础)的版本,对于入门学习最好。 Cloudera在大型互联网企业中用的较多。 Hortonworks文档较好。 Apache Hado ...
分类:
其他好文 时间:
2020-07-12 00:59:06
阅读次数:
92
hadoop是什么? 是一个分布式基础架构,主要解决海量数据存储以及数据分析计算问题。 hadoop三大发行版本? Apache、clourdera、Hortonworks hadoop优势? 高可靠、高扩展、高效、高容错 hadoop1.x和2.x的区别? HDFS(hadoop distribu ...
分类:
其他好文 时间:
2020-01-30 14:29:07
阅读次数:
79
Hadoop三大发行版本:Apache、Cloudera、Hortonworks。 Apache版本最原始(最基础)的版本,对于入门学习最好。 Cloudera在大型互联网企业中用的较多。 Hortonworks文档较好。 Apache Hadoop 官网地址:http://hadoop.apach ...
分类:
其他好文 时间:
2019-12-27 21:49:03
阅读次数:
82
下载: yum -y install gcc gcc-c++ maven下载地址Github:https://github.com/hortonworks/hive-testbench/git clone https://github.com/hortonworks/hive-testbench/ ...
分类:
其他好文 时间:
2019-11-18 13:19:59
阅读次数:
433
HDP(Hortonworks Data Platform)是hortworks推出的100%开源的hadoop发行版本,以YARN 作为其架构中心,包含pig、hive、phoniex、hbase、storm、spark等大量组件,在最新的2.4版本,监控UI实现与grafana集成,包含组件版本 ...
分类:
其他好文 时间:
2019-10-02 00:52:57
阅读次数:
138
概述 以 Hortonworks Data Platform (HDP) 平台为例 ,hadoop大数据平台的安全机制包括以下两个方面: 身份认证 即核实一个使用者的真实身份,一个使用者来使用大数据引擎平台,这个使用者需要表明自己是谁,即提供自己的身份证明,大数据平台需要检验这个证明,确定这个证明是 ...
分类:
其他好文 时间:
2019-08-06 01:11:23
阅读次数:
184
1 详细异常 2 查询到的一些信息 https://community.hortonworks.com/questions/149867/orgapachephoenixcoprocessorhashjoincachenotfoundex.html 里面提到增加regionserver的这个参数来解 ...
分类:
Web程序 时间:
2019-07-27 13:14:09
阅读次数:
244
一、file formatORCFile在HDP 2:更好的压缩,更好的性能:https://zh.hortonworks.com/blog/orcfile-in-hdp-2-better-compression-better-performance/官方ORCfile介绍:https://cwik... ...
分类:
其他好文 时间:
2019-04-26 14:49:22
阅读次数:
160
https://docs.hortonworks.com/HDPDocuments/HDP2/HDP-2.6.5/bk_yarn-resource-management/content/ch_yarn_rest_apis.html ...