HDFS小文件问题及解决方案:http://dongxicheng.org/mapreduce/hdfs-small-files-solution/Hadoop升级方案(一):Hadoop
1.0内部版本升级(初稿):http://dongxicheng.org/mapreduce-nextgen/...
分类:
其他好文 时间:
2014-05-10 02:08:24
阅读次数:
327
单词计数是最简单也是最能体现MapReduce思想的程序之一,可以称为MapReduce版"Hello
World",该程序的完整代码可以在Hadoop安装包的"src/examples"目录下找到。单词计数主要完成功能是:统计一系列文本文件中每个单词出现的次数,如下图所示。现在我们以"hadoop...
分类:
其他好文 时间:
2014-05-10 01:54:48
阅读次数:
445
# --*-- coding: utf-8 --*--from
matplotlib.font_manager import FontPropertiesimport matplotlib.pyplot as pltfont
= FontProperties(fname=r"/usr/share/f...
分类:
其他好文 时间:
2014-05-09 11:51:09
阅读次数:
323
这是kbmmw 作者关于认证管理器的说明,我懒得翻译了,自己看吧。There are 5 parts
of setting up an authorization manager: A) Defining what the resources are
(often services or servi...
分类:
其他好文 时间:
2014-05-09 11:33:05
阅读次数:
471
以上问题的解决方式如下:1.
打开windows运行对话框。在对话框输入mmc。打开了如图所示的控制台。2. 文件---添加/删除管理单元(M)。3. 添加。然后选择Microsoft
SQL 企业管理器。添加。4. 文件---选项---用户模式-完全访问---应用---确定。5.回到控制台,另存为...
分类:
数据库 时间:
2014-05-09 11:17:41
阅读次数:
352
Hadoop
MapReduce开发最佳实践(上篇)本文是Hadoop最佳实践系列第二篇,上一篇为《Hadoop管理员的十个最佳实践》。MapRuduce开发对于大多数程序员都会觉得略显复杂,运行一个WordCount(Hadoop中hello
word程序)不仅要熟悉MapRuduce模型,还要了...
分类:
其他好文 时间:
2014-05-08 21:45:46
阅读次数:
640
dataguru访问地址:http://f.dataguru.cn/?fromuid=99611课程优惠码:C4B6这段时间一直在dataguru(炼数成金)上学习《hadoop数据分析平台(第十四期)》,说说我对炼数成金的印象。最开始听说dataguru是通过它的广告邮件中的链接,发送的对象是it...
分类:
其他好文 时间:
2014-05-08 21:19:30
阅读次数:
727
Hadoop集群(第9期)_MapReduce初级案例 - 虾皮 - 博客园1、数据去重
"数据去重"主要是为了掌握和利用并行化思想来对数据进行有意义的筛选。统计大数据集上的数据种类个数、从网站日志中计算访问地等这些看似庞杂的任务都会涉及数据去重。下面就进入这个实例的MapReduce程序设计。1....
分类:
其他好文 时间:
2014-05-08 20:38:16
阅读次数:
669
1.核心 HDFS 分布式文件系统 主从结构,一个namenoe和多个datanode,
分别对应独立的物理机器
1)NameNode是主服务器,管理文件系统的命名空间和客户端对文件的访问操作。NameNode执行文件系统的命名空间操作,比如打开关闭重命名文件或者目录等,它也负责...
分类:
其他好文 时间:
2014-05-05 10:35:14
阅读次数:
432
转自:http://blog.csdn.net/bluesky8640/article/details/6945776之前装python、jdk、hadoop都是用的root账户,这是一个绝对的失策,linux对用户访问权限很严格,新创的hod账户根本无法启动hadoop,而root在hod模式下使...
分类:
系统相关 时间:
2014-05-05 10:09:20
阅读次数:
753