kudu表的Tips(小知识点)、复制表(备份表中数据)时指定存储格式、主键变动时数据量变多变少的问题
kudu表的Tips(小知识点)
1、kudu表会根据主键去重
2、kudu表不支持insert overwrite只能用insert into
3、kudu表可以upsert into
复制表(备份表中数据)时指定存储格式
--例如:可以复制分区表
-- 将app_api_ent_bond_cash_di数据插入app_api_ent_bond_cash_di_bak20220715(备份表)
create table fin_dw.app_api_ent_bond_cash_di_bak20220715 stored as parquet as
select * from fin_dw.app_api_ent_bond_cash_di;
主键变动时数据变多变少的问题
这个问题是出现在债券预估现金流实时接口中,由于业务主键发生变化(sec_code➡sec_inner_code)所以实时接口那条线中的MySQL表需要重建表,并将数据全部刷进去
当时做的时候并未考虑到数据量会根据主键的变化,发生变化(考虑的不深)
现在把这个问题拿过来总结一下:
其实原理就是:

而MySQL会根据主键去重,所以数据量会发生变化

浙公网安备 33010602011771号