搜索关键字：hadoop 安全模式，搜索到14428个结果！码迷,mamicode.com！

Ubuntu 安装 spark

环境： Unbunt 12.04 Hadoop 2.2.x Sprak 0.9 Scala scala-2.9.0.final.tgz 步骤 1. 下载 scala 2. 解压scala，然后修改/etc/profile，添加如下 export SCALA_HOME=/home/software/scala-2.9.0.final export PATH=$P...

分类：其他好文时间：2014-06-05 11:52:46 阅读次数：484

标准wordcount

package wordcount; import java.io.IOException; import java.util.StringTokenizer; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.Int...

分类：其他好文时间：2014-06-05 09:12:55 阅读次数：203

淘宝在hbase中的应用和优化

本文来自于NoSQLFan联合作者@koven2049，他在淘宝从事Hadoop及HBase相关的应用和优化。对Hadoop、HBase都有深入的了解，本文就是其在工作中对HBase的应用优化小结，分享给大家。目录 [ - ] 前言原因应用情况部署、运维和监控测试与发布改进和优化将来计划前言 hbase是从 hadoop中分离出来的apache顶级开源项目。由...

分类：其他好文时间：2014-06-05 08:43:04 阅读次数：275

scp and tar

scp 命令随记 scp file username@remoteIp:directory 创建tar包 tar zcvf file.tar.gz directory tar zcvf hadoop.tar.gz /hadoop...

分类：其他好文时间：2014-06-05 07:36:35 阅读次数：199

HDSF主要节点讲解(二)工作原理

hadoop数据写入和读之原理分析...

分类：其他好文时间：2014-06-05 00:58:34 阅读次数：233

在Hadoop中重写FileInputFormat类以处理二进制格式存储的整数

最近开始使用MapReduce，发现网上大部分例子都是对文本数据进行处理的，也就是说在读取输入数据时直接使用默认的TextInputFormat进行处理即可。对于文本数据处理，这个类还是能满足一部分应用场景。但是如果要处理以二进制形式结构化记录存储的文件时，这些类就不再适合了。本文以一个简单的应用场景为例：对按照二进制格式存储的整数做频数统计。以此来说明如何重写FileInputFormat来实现对非文本数据的处理。...

分类：其他好文时间：2014-06-04 21:53:46 阅读次数：341

Hadoop与HBase中遇到的问题(续)java.io.IOException: Non-increasing Bloom keys异常

在使用Bulkload向HBase导入数据中, 自己编写Map与使用KeyValueSortReducer生成HFile时, 出现了下面的异常: java.io.IOException: Non-increasing Bloom keys: 201301025200000000000003520000000000000500 after 20131119510000000000000001...

分类：编程语言时间：2014-06-03 05:55:44 阅读次数：359

浅谈hadoop中mapreduce的文件分发

DistributedCache 是一个提供给Map/Reduce框架的工具，用来缓存文件（text, archives, jars and so on）...

分类：其他好文时间：2014-06-03 02:18:37 阅读次数：332

Hbase在数据统计中的应用心得

1. 数据统计的需求互联网上对于数据的统计，一个重要的应用就是对网站站点数据的统计，例如CNZZ站长统计、百度统计、Google Analytics、量子恒道统计等等。网站站点统计工具无外乎有以下一些功能： 1）网站流量统计：包括PV、UV、IP等指标，这些统计指标可以以趋势图的形式展示出来，如最近一周、最近一个月等。 2）IP来源信息统计：记录各个来源IP下的访问PV...

分类：其他好文时间：2014-06-03 01:33:36 阅读次数：226

Hadoop YARN资源隔离技术

YARN对内存资源和CPU资源采用了不同的资源隔离方案。对于内存资源，它是一种限制性资源，它的量的大小直接决定应用程序的死活，因为应用程序到达内存限制，会发生OOM，就会被杀死。CPU资源一般用Cgroups进行资源控制，Cgroups控制资源测试可以参见这篇博文Cgroups控制cpu，内存，io...

分类：其他好文时间：2014-05-31 18:47:58 阅读次数：264

共14428条上一页 1 ... 1414 1415 1416 1417 1418 ... 1443 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)