码迷,mamicode.com
首页 >  
搜索关键字:HDFS    ( 4980个结果
hadoop的伪分布
cd/hoperunln-shadoop-0.20.2hadoopln-sjdk1.6.0_21jdkvi/hadoop/conf/hadoop-env.shexportJAVA_HOME=/hoperun/jdkvi/hadoop/conf/core-site.xml<property><name>fs.default.name</name><value>hdfs://localhost:9000</value></property>v..
分类:其他好文   时间:2014-10-06 23:42:03    阅读次数:217
Apache Hadoop2.4.1 Filesystem shell
overview 文件系统(FS) shell包含各种与HDFS交互的命令,?比如 Local FS, HFTP FS, S3 FS, and other. FS shell 执行通过下面的命令: bin/hdfs dfs <args> 所有的FS shell的可以使用路径URI作为参数。URI的格式...
分类:其他好文   时间:2014-10-04 07:04:46    阅读次数:223
Rhel6-hadoop分布式部署配置文档
理论基础:Hadoop 分布式文件系统架构HDFS 负责大数据存储MapReduce 负责大数据计算namenode master守护进程datanode slaves上负责存储的进程secondarynamenode master上提供周期检查和清理任务的进程jobtracker maste...
分类:其他好文   时间:2014-10-03 01:34:04    阅读次数:451
MapReduce 编程 系列八 根据输入路径产生输出路径和清除HDFS目录
有了前面的MultipleOutputs的使用经验,就可以将HDFS输入目录的路径解析出来,组成输出路径,这在业务上是十分常用的。这样其实是没有多文件名输出,仅仅是调用了MultipleOutputs的addNamedOutput方法一次,设置文件名为result.先看pom.xml, 现在参数只有一个输入目录了,输出目录会在该路径后面自动加上/output.<project xmlns="htt...
分类:其他好文   时间:2014-10-03 00:03:53    阅读次数:393
spark+hadoop+sqoop+hive平台bug解决方法
bug集锦1. hadoop平台datanode无法启动:原因: 由于多次hdfs namenode -format导致dfs/data/current/version中的cluserID与当前的cluserID不统一,通过查看hadoop/logs中的datanode日志文件查看到此错误。解决方....
分类:其他好文   时间:2014-10-02 23:55:33    阅读次数:205
从本地上传整个目录到hdfs的java程序
首先在网上找了好久没有找到从本地文件系统上传整个目录到hdfs文件系统的程序,权威指南上也没有,都是单个文件上传,所以这里自己编写了一个程序,封装成jar包执行能够复制。先说明一下代码:须要手动输入两个路径,一个本地文件/目录路径,第二个是hdfs目录路径。好直接上代码:import java.io...
分类:编程语言   时间:2014-10-02 17:02:53    阅读次数:186
Apache Spark1.1.0部署与开发环境搭建
Spark是Apache公司推出的一种基于Hadoop Distributed File System(HDFS)的并行计算架构。与MapReduce不同,Spark并不局限于编写map和reduce两个方法,其提供了更为强大的内存计算(in-memory computing)模型,使得用户可以.....
分类:其他好文   时间:2014-10-01 17:33:51    阅读次数:456
etl工具,kettle实现循环
业务模型: 在关系型数据库中有张很大的表,被设计成奇偶库存储,每个库100张一模一样的表,每张表存储1000W,字段切换到下一个表。现需要同步这个数据到hive中(hdfs),循环抽取这些数据。如果是抽取增量的带上增量字段(每天增量数据存储在哪个表,奇数库还是偶数库是不知道的)。...
分类:其他好文   时间:2014-10-01 09:25:40    阅读次数:367
HBase相关
HBase为可伸缩海量数据存储而设计,实现面向在线业务的实时数据访问延迟。HBase的伸缩性主要依赖其可分裂的HRegion及可伸缩的分布式文件系统HDFS实现。HBase中,数据以HRegion为单位进行管理,也就是说应用程序如果想要访问一个数据,必须先找到HRegion,然后将数据读写操作提..
分类:其他好文   时间:2014-10-01 00:39:00    阅读次数:249
MapReduce的一点理解
对于MapReduce编程,大概率的流程用过的人或多或少都清楚,但是归结到细节上,就有的地方不清楚了,下面根据自己的疑问,加上从网上各处,找到的被人的描述,最自己的疑问做出回答。1. MapReduce 和 HDFS有什么关系? 首先,HDFS和MapReduce是Hadoop最核心的设计; 对.....
分类:其他好文   时间:2014-09-30 18:54:49    阅读次数:871
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!