码迷,mamicode.com
首页 >  
搜索关键字:hbase hadoop    ( 16410个结果
安装Hadoop
一、大数据 大数据的特性 (一)大体量,可从数百TB,PB,EB (二)多样性,大数据包括各种格式和形态的数据 (三)时效性,很多大数据需要在一定的时间限度下得到及时处理 (四)准确性,处理的结果一定要准备性 (五)大价值,大数据包含很多的深度的价值,大数据分析挖掘和利用将带来巨大的商业价值 二、H ...
分类:其他好文   时间:2020-09-18 02:20:12    阅读次数:35
Eclipse 配置hadoop
#1.安装Eclipse EE版本 #2.配置Eclipse 配置Eclipse 将插件hadoop-eclipse-plugin-2.6.0jar拷贝到Eclipse安装目录下的dropins目录 启动Eclipse,增加Map/Reduce功能区 增加Hadoop集群的连接 导入MapReduc ...
分类:系统相关   时间:2020-09-18 01:39:40    阅读次数:46
Hadoop和Yarn的配置文件
Hadoop配置文件
分类:其他好文   时间:2020-09-18 00:36:12    阅读次数:32
Hive SQL使用过程中的奇怪现象
hive是基于Hadoop的一个数据仓库工具,用来进行数据的ETL,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能。HiveSQL是一种类SQL语言,与关系型数据库所支持的SQL语法存在微小的差异。本文对比MySQL和Hive所支持的SQL语法,发现相同的SQL语句在Hive和MySQL中输出结果的会有所不同
分类:数据库   时间:2020-09-17 23:41:17    阅读次数:49
【AWS征文】[大数据][Hadoop] 使用EMR做大数据分析
实验包括:1.使用EMR创建Hadoop集群2.定义schema,创建示例表。3.通过HiveQL分析数据,并将分析结果保存到S3上4.下载已经分析结果数据。Task1:创建一个S3桶创建一个存储桶比如hadoop202006…Task2:创建EMR集群这里我解释一下Hadoop集群中的一些组件,了解大数据的同学直接忽略就好。ApacheHadoop:在分布式服务器集群上存储海量数据并运行分布式分
分类:其他好文   时间:2020-09-17 22:02:51    阅读次数:37
Hadoop环境搭建
Hadoop环境搭建 #### 安装前准备 查看防火墙状态,若处于激活(inaction)状态,关闭防火墙 sudo ufw status 查看时间服务器是否运行,若NTP尚未安装就运行安装命令 dpkg -l | grep ntp #检查是否安装 apt-get install ntp #NTP安 ...
分类:其他好文   时间:2020-09-17 21:43:01    阅读次数:32
大数据平台搭建包含哪些层级
大数据分析平台的搭建有利于帮助企业构建统一的数据存储和数据处理资源,围绕企业业务开展大数据应用建设,最终形成面向服务化的数据资产。而今天我们就来了解一下,常见的大数据平台都包含哪些层次?  1、数据采集层:分3个层面的采集技术进行支持,一是传统业务系统数据库和半结构化、结构化数据的采集和集成,如采用Sqoop技术进行关系数据库和Hadoop系统之间的数据抽取和交换;二是交通实时流数据的采集,包
分类:其他好文   时间:2020-09-17 20:18:31    阅读次数:34
大数据平台搭建包含哪些层级
大数据分析平台的搭建有利于帮助企业构建统一的数据存储和数据处理资源,围绕企业业务开展大数据应用建设,最终形成面向服务化的数据资产。而今天我们就来了解一下,常见的大数据平台都包含哪些层次?  1、数据采集层:分3个层面的采集技术进行支持,一是传统业务系统数据库和半结构化、结构化数据的采集和集成,如采用Sqoop技术进行关系数据库和Hadoop系统之间的数据抽取和交换;二是交通实时流数据的采集,包
分类:其他好文   时间:2020-09-17 19:57:01    阅读次数:24
Hadoop join
一、Map端的主要工作 为来自不同表或文件的key/value对,打标签以区别不同来源的记录。 然后用连接字段作为key,其余部分和新加的标志作为value,最后进行输出。 二、Reduce端的主要工作 在Reduce端以连接字段作为key的分组已经完成, 我们只需要在每一个分组当中将那些来源于不同 ...
分类:其他好文   时间:2020-09-17 19:03:58    阅读次数:23
大数据图谱
Sqoop 在hadoop和关系型数据库之间转换数据 Flume Flume是一个分布式的高可用的数据收集、聚集和移动的工具。通常用于从其他系统搜集数据,如web服务器产生的日志,通过Flume将日志写入到Hadoop的HDFS中 Canal 数据抽取是 ETL 流程的第一步。我们会将数据从 RDB ...
分类:其他好文   时间:2020-09-17 18:33:30    阅读次数:37
16410条   上一页 1 ... 22 23 24 25 26 ... 1641 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!