搜索关键字：使用hadoop ecipse插件需要注，搜索到226个结果！码迷,mamicode.com！

真正了解sqoop的一切

一．sqoop的简单概论 1.sqoop产生的原因： A. 多数使用hadoop技术的处理大数据业务的企业，有大量的数据存储在关系型数据中。 B. 由于没有工具支持，对hadoop和关系型数据库之间数据传输是一个很困难的事。依据以上的原因sqoop产生的。 2. sqoop的介绍 sqoop是连接 ...

分类：其他好文时间：2021-06-08 22:45:15 阅读次数：0

使用hadoop解决找博客共同好友问题

写在前面首先我们来看看需求，以下是某博客的好友列表数据，冒号前是一个用户，冒号后是该用户的所有好友（好友关系是单向的）： A:B,C,D,F,E,O B:A,C,E,K C:F,A,D,I D:A,E,F,L E:B,C,D,M,L F:A,B,C,D,E,O,M G:A,C,D,E,F H:A, ...

分类：其他好文时间：2020-09-10 22:33:47 阅读次数：36

Hadoop - hdfs dfs常用命令的使用

Hadoop - hdfs dfs常用命令的使用用法 1，-mkdir 创建目录Usage：hdfs dfs -mkdir [-p] < paths>选项：-p很像Unix mkdir -p，沿路径创建父目录。 2，-ls 查看目录下内容，包括文件名，权限，所有者，大小和修改时间Usage：hdf ...

分类：其他好文时间：2020-07-21 21:48:33 阅读次数：80

解决HDFS上小文件的存储

从源头上解决，在上传到HDFS之前，就将多个小文件归档使用tar命令带上参数-zcvf 示例： tar -zcvf xxx.tar.gz 小文件列表如果小文件已经上传到HDFS了，可以使用在线归档使用hadoop archive命令示例： hadoop archive -archiveNa ...

分类：其他好文时间：2020-07-11 17:00:14 阅读次数：76

HDFS学习之客户端API操作

org.apache.hadoop.fs.FileSystem是Hadoop中一个相当通用的文件系统的抽象基类，它是一个面向最终用户的接口类。应该将所有可能使用Hadoop分布式文件系统的用户代码编写为使用一个FileSystem对象。Hadoop DFS是一种多机系统，显示为单个磁盘，由于其容错能 ...

分类：Windows程序时间：2020-05-23 18:35:18 阅读次数：74

KILL hive 执行中的job任务

使用hadoop job -list来列出当前hadoop正在执行的jobs 然后使用hadoop job -kill job_1546932571227_0082来杀死该job任务，原文链接：https://blog.csdn.net/zhy_2117/java/article/details/ ...

分类：其他好文时间：2020-05-07 19:48:36 阅读次数：124

HDFS常用命令总结

hdfs文件的相关操作主要使用hadoop fs、hadoop dfs、hdfs dfs 命令，以下对最常用的相关命令进行简要说明。hadoop fs -ls 显示当前目录结构，-ls -R 递归显示目录结构hadoop fs -mkdir 创建目录hadoop fs -rm 删除文件，-rm -R ...

分类：其他好文时间：2020-04-10 00:20:12 阅读次数：66

Hadoop简介

大数据开发总体架构： Hadoop是大数据开发所使用的一个核心框架。使用Hadoop可以方便的管理分布式集群，将海量数据分布式的存储在集群中，并使用分布式并行程序来处理这些数据。 Hadoop由许多子系统组成，如下图： Hadoop1.x与2.x的对比： YARN：管理集群资源（内存、CPU） ...

分类：其他好文时间：2020-03-17 19:30:09 阅读次数：49

hadoop之HDFS核心类Filesystem的使用

1.导入jar包，要使用hadoop的HDFS就要导入hadoop 2.7.7\share\hadoop\common下的3个jar包和lib下的依赖包、hadoop 2.7.7\share\hadoop\hdfs下的3个jar包和lib下的依赖包 2. ls 查看目录下的所有文件和文件夹 4. m ...

分类：其他好文时间：2020-02-22 15:32:40 阅读次数：58

2.Spark 版本与运行环境

当前Spark最新版本为Spark 2.4.5。Spark 使用Hadoop’s client libraries 存取HDFS and YARN。下载是流行hadoop版的便宜预包装。用户也可以下载免hadoop的二进制包，通过参数Spark’s classpath 运行spark 用于任何Had ...

分类：其他好文时间：2020-02-22 13:56:26 阅读次数：182

共226条 1 2 3 4 ... 23 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)