kudu表的Tips(小知识点)、复制表(备份表中数据)时指定存储格式、主键变动时数据量变多变少的问题

kudu表的Tips(小知识点)

1、kudu表会根据主键去重

2、kudu表不支持insert overwrite只能用insert into

3、kudu表可以upsert into

复制表(备份表中数据)时指定存储格式

--例如:可以复制分区表
-- 将app_api_ent_bond_cash_di数据插入app_api_ent_bond_cash_di_bak20220715(备份表)
create table fin_dw.app_api_ent_bond_cash_di_bak20220715 stored as parquet as
select * from fin_dw.app_api_ent_bond_cash_di;

主键变动时数据变多变少的问题

这个问题是出现在债券预估现金流实时接口中,由于业务主键发生变化(sec_codesec_inner_code)所以实时接口那条线中的MySQL表需要重建表,并将数据全部刷进去

当时做的时候并未考虑到数据量会根据主键的变化,发生变化(考虑的不深)

现在把这个问题拿过来总结一下:

其实原理就是:

而MySQL会根据主键去重,所以数据量会发生变化

posted @ 2022-07-20 17:07  赤兔胭脂小吕布  阅读(311)  评论(0)    收藏  举报