码迷,mamicode.com
首页 >  
搜索关键字:hadoop map reduce 分区 分组    ( 64817个结果
Oracle 11g 通过间隔分区实现按月创建表分区
在项目数据库设计过程中由于单表的数据量非常庞大,需要对表进行分区处理。由于表中的数据是历史交易,故按月分区,提升查询和管理。   由于之前对于表分区了解不多,为了实现上述功能查了很多资料,一开始的方向是通过Crontab调用Shell脚本来按月自动创建分区,或者使用Oracle的Job调用存储过程来自动创建分区。在研究上述两套方案的过程中,无意发现Oracle11g有间隔分区功能,对于使用Ran...
分类:数据库   时间:2014-05-07 02:51:26    阅读次数:350
hadoop yarn running beyond physical memory used
老是报物理内存越界,kill container,然后把yarn.scheduler.minimum-allocation-mb设成2048就好了跟这个yarn.nodemanager.pmem-check-enabled参数应该也有关系在这篇文章中得到启发:http://bise.aliapp.c...
分类:其他好文   时间:2014-05-07 02:15:35    阅读次数:409
Hadoop-3、Mapred并行思想WordCount
import java.io.IOException;import java.util.StringTokenizer;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.ap...
分类:其他好文   时间:2014-05-07 01:06:02    阅读次数:271
java.util.ConcurrentModificationException
错误原因:在使用迭代器过程中对迭代对象进行操作导致。示例代码: 1 Map map=new HashMap(); 2 map.put("a", "aa"); 3 map.put("b", "bb"); 4 map.put("c", "cc"); 5 ...
分类:编程语言   时间:2014-05-07 00:37:09    阅读次数:354
Hbase学习笔记(安装和基础知识及操作)
参考书籍: Hadoop in action, 吴超沉思录1.Hbase简介 1.面向列的分布式数据库 2. 以HDFS作为文件系统 3. 利用MapReduce处理Hbase中海量数据 4. ZookKeeper作为协调工具 5. sqoop提供Hbase到关系型数据库中数据导入功能 ...
分类:其他好文   时间:2014-05-07 00:35:59    阅读次数:424
Hadoop权威指南读书笔记
mapreduce数据本地化(核心特征)、无共享。    1  HDFS的设计 为了存储超大文件 流式访问(一次写入多次读取)商用硬件(不需要超豪华的机器)    2  数据快(block) 磁盘一般是512字节 HDFS默认是64M 但与其他文件系统不同的是小于一个块大小的文件不会占用整个块的空间。块为什么设置这么大?(最小化寻址开销)块抽象带来的好处(一个文件的...
分类:其他好文   时间:2014-05-06 23:26:24    阅读次数:519
thinkPHP--模块分组
启用分组模块非常简单,配置下APP_GROUP_LIST参数和DEFAULT_GROUP参数即可。 'APP_GROUP_LIST'=>'Admin,Home', 'DEFAULT_GROUP'=>'Home',将Home设为默认的项目。 在我们启用项目分组之前,由于使用的两个项目,所以URL地址分别是: http://serverName/index.php/Index/...
分类:Web程序   时间:2014-05-06 22:39:00    阅读次数:520
[051] 微信公众平台开发教程第22篇-如何保证access_token长期有效
为了使第三方开发者能够为用户提供更多更有价值的个性化服务,微信公众平台开放了许多接口,包括自定义菜单接口、客服接口、获取用户信息接口、用户分组接口、群发接口等,开发者在调用这些接口时,都需要传入一个相同的参数access_token,它是公众账号的全局唯一票据,它是接口访问凭证。 access_token的有效期是7200秒(两小时),在有效期内,可以一直使用,只有当access_token过期时...
分类:微信   时间:2014-05-06 22:25:24    阅读次数:743
计算机、程序和java概述(一)
CPU通常由两部分组成:控制器和算数/逻辑运算器控制器用于控制和协调各个组件的工作。算术逻辑运算器用于数值运算和逻辑运算。1MHz(兆赫)=100万Hz内存也称随机存储器(RAM)。操作系统的主要任务有:控制和监视系统的活动分配系统资源安排操作的顺序javaapplication:应用程序是独..
分类:编程语言   时间:2014-05-06 20:41:06    阅读次数:363
mysql存储过程、存储函数及流程控制
存储过程 一、基本语法 createproceduresp_name([proc_parameter[,...]]) [characteristic...]routine_body begin end sp_name表示存储过程的名字 proc_parameter存储过程参数例表[INOUTINOUT]三个部分组成 其中IN表示传进来的参数 其中OUT表示传出去的参数 其中INOUT表示传进..
分类:数据库   时间:2014-05-06 20:26:10    阅读次数:404
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!