摘要: 一、方案背景 现阶段部分业务数据存储在HBase中,这部分数据体量较大,达到数十亿。大数据需要增量同步这部分业务数据到数据仓库中,进行离线分析,目前主要的同步方式是通过HBase的hive映射表来实现的。该种方式具有以下痛点: 需要对HBase表进行全表扫描,对HBase库有一定压力,同步数据同步速 阅读全文
posted @ 2022-03-15 12:44 vivo互联网技术 阅读(593) 评论(1) 推荐(0)