问题：

配置单元acid更新和删除错误

陈渊

2023-03-14

我使用Hive1.2.1和TEZ0.7进行测试，但是当我使用acid表进行更新和删除时，出现了一些问题，下面是表的结构：

CREATE EXTERNAL TABLE IF NOT EXISTS working.dw_items_w
(
column defination
)
CLUSTERED BY (id) into 5000 buckets
STORED AS ORC
LOCATION '/sys/edw/working/dw_items_w2'
TBLPROPERTIES ("transactional"="true");

update working.dw_items_w
set 
PROCESS_FLAG =(case when (
(TGT_LSTG_STATUS_ID = 1 and (to_date(SALE_END) - to_date(TGT_AUCT_END_DT) ) <> 0 )
or  (TGT_LSTG_STATUS_ID in (1,2) and NEW_LSTG_STATUS_ID in (0,4) )   
) then  'D' 
when 
((TGT_LSTG_STATUS_ID =1 and NEW_LSTG_STATUS_ID = 1 and datediff(to_date(SALE_END) ,to_date(TGT_AUCT_END_DT) 
) = 0 )
or (TGT_LSTG_STATUS_ID = 2 and NEW_LSTG_STATUS_ID = 1)) then 'X' else PROCESS_FLAG end ),
NEW_LSTG_STATUS_ID = (case when TGT_LSTG_STATUS_ID = 0  AND NEW_LSTG_STATUS_ID = 0   AND to_date(SALE_END)
 <  date_sub(to_date( from_unixtime(unix_timestamp(),'yyyy-MM-dd') ), 92)
     AND to_date(SALE_END)  <> to_date('1969-12-31') then 1 else NEW_LSTG_STATUS_ID end) 

where PROCESS_FLAG = 'U';

共有1个答案

耿俊彦

2023-03-14

将以下内容添加到hive-site.xml

<property>
    <name>hive.enforce.bucketing</name>
    <value>true</value>
</property>
<property>
    <name>hive.compactor.initiator.on</name>
    <value>true</value>
</property>
<property>
    <name>hive.support.concurrency</name>
    <value>true</value>
</property>
<property>
    <name>hive.compactor.worker.threads</name>
    <value>1</value>
</property>
<property>
    <name>hive.txn.manager</name>
    <value>org.apache.hadoop.hive.ql.lockmgr.DbTxnManager</value>
</property>

然后确保您正在创建一个带有bucketing的ORC表：

如果不存在则创建表foo.tableinfo(schema_name varchar(32)、table_name varchar(64)、department varchar(64)、country varchar(64)、state varchar(64)、city varchar(64)、granularity int、notes varchar(256))由(table_name)聚类到4个存储为ORC TBLPROPERTIES（“ORC.compress”=“zlib”,“transactional”=“true”）的桶中；

则以下操作将起作用：

从foo.tableinfo中删除table_name='foo'；

类似资料：

更改配置单元表添加或删除列

我在配置单元中有orc表我想从这个表中删除列但我遇到以下异常执行配置单元查询时出错：OK失败：ParseException行1:35输入“USER_ID1”不匹配，在drop PARTITION语句中的“drop”附近需要分区有谁能帮助我或提供任何想法来做这件事吗？注意，我正在
使用配置单元jdbc连接的配置单元ACID事务属性

我试图在Hive0.14中执行HiveACID事务属性，比如通过Java插入、删除和更新。我能够设置所需的ACID事务属性。还可以创建具有事务属性的表。但它失败了。下面是示例代码：尝试插入时获得以下异常：线程“main”java中出现异常。sql。SQLException:处理语句时出错：失败：执行错误，从组织返回代码1。阿帕奇。hadoop。蜂箱ql.exec。org的MapRedTask先
更新配置单元UDF的jar

TL；DR：我如何在Hive中更新自定义UDF的jar？我写了自己的（通用）udf，工作得很好。我可以定义一个新函数，并将其与命令一起使用： null null
从配置单元表动态删除分区

我有一个配置单元表，其中一个date列上存在分区，但date列以YYYYMMDD格式存储为INT。该表还可以包含未来日期分区的数据。现在，作为过程的一部分，我希望删除那些在处理日（位于处理日）上运行的分区。当我编写drop分区时，比如，那么它工作正常。考虑到我的输入将是唯一的日期格式YYYY-MM-DD和我已经删除所有分区已给出输入日期-1；如何使上述陈述奏效？
在配置单元中一次删除多列

我必须删除大约7列，所以正在寻找一个优雅的方法
更新和删除数据

利用UPDATE和DELETE语句进行操作表数据。更新数据 UPDATE用来更新修改表中的数据更新表中特定的行更新表中所有行注意: 如果省略了WHERE子句，就会更新所有行。 UPDATE语句有三个部分组合要更新的表列名和他们的新值确定要更新哪些行的过滤条件 mysql> UPDATE Customers -> SET cust_email = '[email protect

配置单元acid更新和删除错误

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档