方法1: /** * 添加一行数据 * * @param tableName * 表名 * @param columnFamily * 列族名 * @param rowKey * ...
分类:
其他好文 时间:
2014-09-10 17:09:30
阅读次数:
493
一、Split触发条件
1、 有任一一个Hfile的大小超过默认值10G时,都会进行split
2、 达到这个值不在拆分,默认为int_max,不进行拆分
3、compaction时,如果compact的store的大小超过了,则进行split
4、 flush之前会检测区域中HStoreFile数目是否超过hbase.h...
分类:
其他好文 时间:
2014-09-10 10:52:00
阅读次数:
266
使用kettle 批量下载文件示例,非常实用且详细的教程,有代码供下载学习!...
分类:
其他好文 时间:
2014-09-10 09:37:20
阅读次数:
184
1. 表的设计1.1 Pre-Creating Regions默认情况下,在创建HBase表的时候会自动创建一个region分区,当导入数据的时候,所有的HBase客户端都向这一个region写数据, 直到这个region足够大了才进行切分。一种可以加快批量写入速度的方法是通过预先创建一些空的reg...
分类:
其他好文 时间:
2014-09-09 17:40:49
阅读次数:
203
package org.robby;
import java.io.IOException;
import java.text.DateFormat;
import java.text.SimpleDateFormat;
import java.util.ArrayList;
import java.util.Date;
import java.util.HashSet;
i...
分类:
其他好文 时间:
2014-09-09 13:26:48
阅读次数:
211
sqoop 导入 hive
hive.HiveImport: Exception in thread "main" java.lang.NoSuchMethodError: org.apache.thrift.EncodingUtils.setBit(BIZ)B
ERROR tool.ImportTool: Encountered IOException running import ...
分类:
编程语言 时间:
2014-09-08 03:15:26
阅读次数:
432
kettle udjc 步骤的详细说明,用示例来辅助学习,非常好的学习kettle资料。...
分类:
编程语言 时间:
2014-09-07 19:53:25
阅读次数:
339
kettle udjc 步骤的详细说明,用示例来辅助学习,非常好的学习kettle资料。...
分类:
编程语言 时间:
2014-09-07 19:53:15
阅读次数:
423
kettle udjc 步骤的详细说明,用示例来辅助学习,非常好的学习kettle资料。...
分类:
编程语言 时间:
2014-09-07 19:52:55
阅读次数:
605
写在前面在这次的审稿过程中有幸得到了Ted Yu和梁堰波先生的反馈,大家就一些感兴趣的内容进行了讨论。该方案由一个智能交通解决方案演变而来,设计之初仅寄希望于通过二级索引提升查询性能,由于在前期架构时充分考虑了通用性以及对复杂条件的支持,在后来的演变中逐渐被剥离出来形成了一个通用的查询引擎。Ted ...
分类:
其他好文 时间:
2014-09-07 14:46:35
阅读次数:
308