3月上海开班时间: 管理员(3月1-4日)Cloudera Certified Administrator For Apache Hadoop; 开发者(3月23-26日)Cloudera Certifed Developer For Spark And Hadoop; 【其他课程安排请咨询】156
分类:
其他好文 时间:
2016-03-22 19:20:37
阅读次数:
531
1、Hadoop开发环境简介 1.1 Hadoop集群简介 Java版本:jdk-6u31-linux-i586.bin Linux系统:CentOS6.0 Hadoop版本:hadoop-1.0.0.tar.gz 1.2 Windows开发简介 Java版本:jdk-6u31-windows-i5
分类:
系统相关 时间:
2016-03-03 11:27:04
阅读次数:
369
在hadoop开发或者使用中,可能会使用到一些插件或3方软件,比如:Eclipse的Hadoop插件,ETL的Kettle。那么就存在一个hdfs目录权限的问题。 下面就这个权限问题进行阐述。
分类:
其他好文 时间:
2016-02-29 12:15:03
阅读次数:
152
pom.xml <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-common</artifactId> <version>2.5.1</version> </dependency> <dependency> <
分类:
其他好文 时间:
2016-02-23 11:14:17
阅读次数:
131
Required Skills
技能要求:
Data Ingest
数据消化:
The skills to transfer data between external systems and your cluster. This includes the following:
在外部系统和集群之间转移数据的技能,包括以下几个:
Import data from a M...
分类:
其他好文 时间:
2016-01-01 13:08:22
阅读次数:
194
前面我们已经搭建了一个伪分布模式的Hadoop运行环境。我们绝大多数都习惯在Eclipse或MyEclipse中做Java开发,本次随笔我就教大家如何搭建一个基于MyEclipse IDE的Hadoop开发环境。闲话少说,走起!第一步 安装MyEclipse的Hadoop插件1 打开MyEclips...
分类:
系统相关 时间:
2015-12-24 00:37:14
阅读次数:
5572
Slots是Hadoop的一个重要概念。然而在Hadoop相关论文,slots的阐述难以理解。网上关于slots的概念介绍也很少,而对于一个有经验的Hadoop开发者来说,他们可能脑子里已经理解了slots的真正含义,但却难以清楚地表达出来,Hadoop初学者听了还是云里雾里。我来尝试讲解一下,以期..
分类:
其他好文 时间:
2015-09-23 01:19:41
阅读次数:
126
困扰了自己1周的一个问题终于得到解决了,感谢给我帮助的同学,同时记录下来分享给大家.问题简化描述:HDFS存在这样格式的文件:用户ID主题ID用户对此主题的偏好分数score。现在要求实现对给定的几个主题T1,T2,T3,...TN,每个主题要求筛选出指定数量的用户ID是M1,M2,M3,...M..
分类:
其他好文 时间:
2015-08-30 23:31:40
阅读次数:
285
已经研究了一段时间的hadoop了,由于最近事情实在太多,完全抽不出时间来整理资料,今天总算有时间了,整理下资料,也算对这段时间的总结吧。
在这互联网时代,大数据的发展已经是势不可挡,顺应时代潮流,冲进互联网风口,研究hadoop也让我心情澎湃
详细的说下hadoop的环境搭建,因为这个过程中对初学者来说是会出现各种各样的问题:
...
分类:
其他好文 时间:
2015-08-09 12:35:10
阅读次数:
165
前三篇文章为Hadoop环境配置和命令行运行程序及查看结果等等。安装eclipse注:只需在master上安装即可在www.eclipse.org下载linux对应32位安装包,在根目录新建eclipse文件夹拷贝eclipse-java-mars-R-linux-gtk.tar.gz到eclips...
分类:
系统相关 时间:
2015-07-13 17:49:26
阅读次数:
198