标签:单元 follow cut 代码 utils creat 完整性 abi argument
事务就是一组单元化操作,这些操作要么都执行,要么都不执行,是一个不可分割的工作单位。
a、 默认事务是关闭的,需要设置开启。
b、需要添加如下配置
<property>
<name>hive.support.concurrency</name>
<value>
true
</value>
</property>
<property>
<name>hive.enforce.bucketing</name>
<value>
true
</value>
</property>
<property>
<name>hive.exec.dynamic.partition.mode</name>
<value>nonstrict</value>
</property>
<property>
<name>hive.txn.manager</name>
<value>org.apache.hadoop.hive.ql.lockmgr.DbTxnManager</value>
</property>
<property>
<name>hive.compactor.initiator.on</name>
<value>
true
</value>
</property>
<property>
<name>hive.compactor.worker.threads</name>
<value>
1
</value>
</property>
HDFS是不支持文件的修改,并且当有数据追加到文件,HDFS不对读数据的用户提供一致性的。为了在HDFS上支持以上的特性,Hive借鉴了其他数据仓库工具的方法。如果Hive中的表开启transaction,数据是insert进去的,则insert进去的数据会放到delta文件夹里面,hive后台会有个进程定时去跟base里的数据合并,然后删除delta文件。即:表和分区的数据都被存在base files。 新的记录和更新,删除都存在delta files。一次事务操作创建一系列的delta files,将其合并为base。在读取的时候,将基础文件和修改,删除合并,最后返回给查询。
创建一个事务表:CREATE table demo (
num string,
create_date int,
number(19,4)
) clustered by (num ) into 40 buckets stored as orc tblproperties(‘transactional‘=‘true‘);
a、表的Base and Delta Directories 目录:
hive> dfs -ls -R /user/hive/warehouse/demo;
d、Worker
当开启了事务,但是没有配置参数,即事务限制条件:
当直接向表格中插入数据时,HDFS中存储的都是delta数据,datax无法读取,会报错:
java.lang.IllegalArgumentException: delta_0051045_0051045 does not start with base_
at org.apache.hadoop.hive.ql.io.AcidUtils.parseBase(AcidUtils.java:144)
at org.apache.hadoop.hive.ql.io.AcidUtils.parseBaseBucketFilename(AcidUtils.java:172)
at org.apache.hadoop.hive.ql.io.orc.OrcInputFormat$FileGenerator.run(OrcInputFormat.java:544)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
at java.lang.Thread.run(Thread.java:748)
2020-02-12 12:58:21.367 [0-0-36-reader] ERROR HdfsReader$Job - 从orcfile文件路径[hdfs://10.20.30.50:8020/inceptor1/user/hive/warehouse/iri.db/hive/var_scr/delta_0051045_0051045/bucket_00017]中读取数据发生异常,请联系系统管理员。
标签:单元 follow cut 代码 utils creat 完整性 abi argument
原文地址:https://www.cnblogs.com/chhyan-dream/p/12302962.html