04 2020 档案

摘要:记录日常工作中实际场景中,对hive分区表的一次启发与实践。 核心操作技巧 hive 指定分区locaiton,进行不同存储位置或协议的数据读取。 业务背景 在业务发展过程中,发现ucloud在某些峰值场景下会出现严重的数据问题,为了服务稳定性与存储可靠性,需要做整体服务云迁移的需求。 整体迁移技术 阅读全文
posted @ 2020-04-21 18:15 Eric-Ln 阅读(1006) 评论(0) 推荐(0)
摘要:前言 本文主要参考淘宝极限存储方案,并结合其他参考文章,总结实践。 整体演示 user (源数据用户表,伪码): create table user ( id bigint, status int, create_time bigint, update_time bigint ) user_all( 阅读全文
posted @ 2020-04-20 14:32 Eric-Ln 阅读(710) 评论(0) 推荐(0)
摘要:此篇文章是总结实际业务中遇到的计算场景问题。 hive 参数调优的文章很多,此篇文章不做类似方面的描述。 文章描述在数据统计场景中,可以通过hive 一些函数的组合使用,极大提高计算效率的方式。 选择一张表中的不同字段值转化为列 演示场景描述: 业务表表 A : table A ( id int, 阅读全文
posted @ 2020-04-01 01:43 Eric-Ln 阅读(988) 评论(0) 推荐(0)