1、KDC 添加用户 ,输入密码 HTTP@HADOOP.COM 2、客户机(linux),kerberos客户端安装 3、客户机(linux),kerberos客户端配置 4、关闭客户机防火墙 systemctl stop firewalld.service 5、配置客户机host文件 6、客户机 ...
分类:
其他好文 时间:
2020-06-08 12:55:03
阅读次数:
154
简介Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统(HadoopDistributedFileSystem),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(highthroughput
分类:
其他好文 时间:
2020-06-06 23:16:21
阅读次数:
84
原因 hadoop.dll 版本问题 解决 查询远程主机中hadoop版本,下载相同或稍高版本的hadoop.dll,将下载的 hadoop.dll 复制到windows系统的c:/window/system32/下 参考 https://blog.csdn.net/Constantdropping ...
分类:
编程语言 时间:
2020-06-06 09:25:40
阅读次数:
69
此博客为博主学习总结,学习内容: 在分布式文件系统中创建文件并用 shell 指令查看; 利用 Java API 编程实现判断文件是否存在以及合并两个文件的内容成一个文件 本次博客记录自己操作的详细步骤 感谢厦门大学数据库实验室的实验教程[http://dblab.xmu.edu.cn/blog/2 ...
分类:
其他好文 时间:
2020-06-06 01:01:04
阅读次数:
97
1、修改配置文件后重启hdfs集群,出现了两个namenode都是standby的问题。 经过不断地排查,发现在自己进行关闭和重启namenode的组件的时候,没有通过pip文件正常关闭,只能挨个关闭,这个也不是重点。 经过修改pip文件的路径,解决了这个批量关闭启动的问题,原因是/tmpe目录系统 ...
分类:
数据库 时间:
2020-06-05 13:12:31
阅读次数:
111
Hadoop fs 命令分类: 1、本地-》HDFS: put(从本地文件系统中复制单个或多个源路径到目标文件系统) hadoop fs -put localfile /user/hadoop/hadoopfile copyFromLocal(和put命令相似) hadoop fs -copyFro ...
分类:
系统相关 时间:
2020-06-02 22:55:20
阅读次数:
78
一、HDFS优缺点 优点: 高容错性 数据自动保存多个副本 某一个副本丢失后,它可以自动恢复 适合处理大数据 数据规模,可以达到PB级 文件规模,能够处理百万规模的文件数量 可构建在廉价机器上,通过多副本保证可靠性 缺点: 不适合低延时数据访问 不适合对大量小文件进行存储 存储大量小文件,他会占用N ...
分类:
其他好文 时间:
2020-06-01 23:45:55
阅读次数:
68
1.1、概述 sqoop是apache旗下一款“Hadoop和关系数据库服务器之间传送数据”的工具。 导入数据:MySQL,Oracle导入数据到Hadoop的HDFS、HIVE、HBASE等数据存储系统; 导出数据:从Hadoop的文件系统中导出数据到关系数据库mysql等 1.2、sqoop1与 ...
分类:
其他好文 时间:
2020-05-31 19:30:40
阅读次数:
69
一、通用优化 1.1、NameNode 的元数据备份使用 SSD 1.2、定时备份 NameNode 上的元数据 建议每小时或者每天备份,如果数据极其重要,可以5~10分钟备份一次。备份可以通过定时任务复制元数据目录即可。 1.3、为 NameNode 指定多个元数据目录 使用 dfs.name.d ...
分类:
系统相关 时间:
2020-05-30 21:52:59
阅读次数:
105
最近工作中用了了Hadoop,比如用Hadoop来处理广告的一些pv量数据、点击数据等,最后统计后给运营展示每个广告的数据报表 首先自己了解了一些关于Hadoop的概念知识 hadoop平台提供了分布式存储(hdfs),分布式计算(mapredduce),任务调度(YARN)、对象存储(Ozone) ...
分类:
其他好文 时间:
2020-05-30 20:22:33
阅读次数:
94