摘要:
更多技术交流、求职机会、试用福利,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 本文将介绍字节跳动在埋点数据流业务场景遇到的需求和挑战以及具体实践,包含埋点数据流简介、埋点数据流建设实践、埋点数据流治理实践以及未来规划。关注字节跳动数据平台微信公众号,回复【0627】获得本次分享材料 阅读全文
posted @ 2022-06-27 14:27
字节跳动数据平台
阅读(1537)
评论(0)
推荐(0)
数据仓库发展历程很久,随着云计算等技术发展以及海量数据应用场景等出现,对数据仓库提出全新要求,高性能、实时性、云原生等成为数据仓库发展关键词,也因此演变出不同的数仓发展路径。 在字节跳动十年发展历程中,各类业务数据量膨胀,不断挑战数据能力边界,也让字节跳动在数据链路优化处理、提升分析效率、数据仓库选 阅读全文
字节的 DataCatalog 系统,在 2021 年进行过大规模重构,新版本的存储层基于 Apache Atlas 实现。迁移过程中,我们遇到了比较多的性能问题。本文以 Data Catalog 系统升级过程为例,与大家讨论业务系统性能优化方面的思考,也会介绍我们关于 Apache Atlas 相关的性能优化。 阅读全文
实时数据湖在字节跳动的实践 阅读全文
UniqueMergeTree 开发的业务背景 首先,我们看一下哪些场景需要用到实时更新。 我们总结了三类场景: 第一类是业务需要对它的交易类数据进行实时分析,需要把数据流同步到 ClickHouse 这类 OLAP 数据库中。大家知道,业务数据诸如订单数据天生是存在更新的,所以需要 OLAP 数据 阅读全文