码迷,mamicode.com
首页 >  
搜索关键字:hadoop hdfs命令    ( 13969个结果
hadoop大数据分析
//使用MapReduce框架完成二次排序 // 主要原理使用组比较器完成排序再规约 // 环境 由于IDEA不会本地提交MR任务转到eclipse //代码如下 package com.swust.mapreduce; import java.io.IOException; import org. ...
分类:其他好文   时间:2020-04-27 19:34:20    阅读次数:80
一、hadoop基本介绍
1.Hadoop的整体框架 Hadoop是由许多元素构成的,最核心的是HDFS(分布式文件系统),它存储了Hadoop集群中所有DataNode文件,HDFS的上一层是MapReduce引擎,MapReduce是一种计算模型,用以进行大数据量的计算。 HDFS HDFS是Hadoop项目的核心子项目 ...
分类:其他好文   时间:2020-04-27 13:27:50    阅读次数:70
单词统计
package hdfs;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.LongWritable;import org.apache.h ...
分类:其他好文   时间:2020-04-27 09:35:22    阅读次数:59
每日一题 为了工作 2020 0426 第五十五题
// hadoop+spark二次排序代码 package com.swust.hadoop; import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaPairRDD; import org.apache.spa ...
分类:其他好文   时间:2020-04-26 16:43:00    阅读次数:64
hadoop 简单安装部署
hadoop第一课:虚拟机搭建和安装hadoop及启动 hadoop第二课:hdfs集群集中管理和hadoop文件操作 hadoop第三课:java开发hdfs hadoop第四课:Yarn和Map/Reduce配置启动和原理讲解 hadoop第五课:java开发Map/Reduce ...
分类:其他好文   时间:2020-04-26 09:15:01    阅读次数:50
hadoop 伪分布配置
配置 Hadoop 伪分布式 任务配置说明: VMware 15 Centos 6.5 java -jdk 1.8 hadoop-2.6.0-cdh5.14.0.tar.gz 第一步 自行安装虚拟机 第二步 开始大配置 修改主机名和用户名 vim /etc/sysconfig/network --( ...
分类:其他好文   时间:2020-04-26 01:41:23    阅读次数:69
HBase入门配置
1.修改hbase env.sh文件 2.修改hbase site.xml文件 3.在conf文件夹中创建hadoop配置文件的软链接 4.分发配置 5.启动RegionServer、Master,只能在指定master节点启动master服务(与Yarn中ResourceManager类似) == ...
分类:其他好文   时间:2020-04-26 01:22:24    阅读次数:78
hadoop三大核心组件介绍
1、Hadoop概述 1.1 Hadoop是什么 Hadoop是Apache旗下的一个用java语言实现开源软件框架,是一个开发和运行处理大规模数据的软件平台 1.2 核心组件 分布式存储系统 HDFS(Hadoop Distributed File System),提供了高可靠性、高扩展性和高吞吐 ...
分类:其他好文   时间:2020-04-25 19:07:28    阅读次数:107
如何将mysql数据导入hive中
1.首先在hive中建表(尽量与mysql字段对应) 2. 将mysql中的表导出 txt格式 3.通过hadoop 上传到HDFS上 命令 hadoop dfs -put /home/hadoop/dim_station_trans_com_info.txt /user/hive/external ...
分类:数据库   时间:2020-04-24 18:41:58    阅读次数:109
Java面试题(多线程篇)
35.并行和并发有什么区别? 1.并行是指两个或者多个事件在同一时刻发生;而并发是指两个或多个事件在同一时间间隔发生。 2.并行是在不同实体上的多个事件,并发是在同一实体上的多个事件。 3.在一台处理器上“同时”处理多个任务,在多台处理器上同时处理多个任务。如hadoop分布式集群。 所以并发编程的 ...
分类:编程语言   时间:2020-04-24 14:32:30    阅读次数:67
13969条   上一页 1 ... 52 53 54 55 56 ... 1397 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!