04 2020 档案
摘要:记录日常工作中实际场景中,对hive分区表的一次启发与实践。 核心操作技巧 hive 指定分区locaiton,进行不同存储位置或协议的数据读取。 业务背景 在业务发展过程中,发现ucloud在某些峰值场景下会出现严重的数据问题,为了服务稳定性与存储可靠性,需要做整体服务云迁移的需求。 整体迁移技术
阅读全文
摘要:前言 本文主要参考淘宝极限存储方案,并结合其他参考文章,总结实践。 整体演示 user (源数据用户表,伪码): create table user ( id bigint, status int, create_time bigint, update_time bigint ) user_all(
阅读全文
摘要:此篇文章是总结实际业务中遇到的计算场景问题。 hive 参数调优的文章很多,此篇文章不做类似方面的描述。 文章描述在数据统计场景中,可以通过hive 一些函数的组合使用,极大提高计算效率的方式。 选择一张表中的不同字段值转化为列 演示场景描述: 业务表表 A : table A ( id int,
阅读全文

浙公网安备 33010602011771号