上一页 1 ··· 47 48 49 50 51
摘要: 来看看字节跳动内部的数据血缘用例与设计 数据血缘描述了数据的来源和去向,以及数据在多个处理过程中的转换。数据血缘是组织内使数据发挥价值的重要基础能力。本文从字节的数据链路概况开始,介绍了数据血缘在字节的应用场景,总体设计,数据模型以及衡量指标。 文 | 罗小亮、拾捌、大滨来自字节跳动数据平台开发套件团队 字节跳动数据链路介绍 为了明确问题 阅读全文
posted @ 2022-02-24 10:49 字节跳动数据平台 阅读(2099) 评论(0) 推荐(0)
摘要: 看SparkSql如何支撑企业数仓 企业级数仓架构设计与选型的时候需要从开发的便利性、生态、解耦程度、性能、 安全这几个纬度思考。本文作者:惊帆 来自于数据平台 EMR 团队 前言 Apache Hive 经过多年的发展,目前基本已经成了业界构建超大规模数据仓库的事实标准和数据处理工具,Hive 已经不单单是一个技术组件,而是一种设计 阅读全文
posted @ 2022-02-21 12:21 字节跳动数据平台 阅读(1089) 评论(0) 推荐(1)
摘要: ClickHouse 在 UBA 系统中的字典编码优化实践 ClickHouse UBA 版本是字节跳动内部在开源版本基础上为火山引擎增长分析专门深度定制优化的版本。 阅读全文
posted @ 2022-02-09 16:10 字节跳动数据平台 阅读(483) 评论(0) 推荐(0)
摘要: 字节跳动数据湖技术选型的思考与落地实践 本文是字节跳动数据平台开发套件团队在 Flink Forward Asia 2021: Flink Forward 峰会上的演讲,着重分享了字节跳动数据湖技术上的选型思考和探索实践。 阅读全文
posted @ 2022-01-24 14:49 字节跳动数据平台 阅读(2471) 评论(0) 推荐(0)
摘要: 从 ClickHouse 到 ByteHouse:实时数据分析场景下的优化实践 在打造 ByteHouse 的过程中,我们经过了多年的探索与沉淀,本文将和大家分享字节跳动过去使用 ClickHouse 的两个典型应用与优化案例。 阅读全文
posted @ 2022-01-19 16:54 字节跳动数据平台 阅读(510) 评论(0) 推荐(0)
摘要: 在字节,A/B 实验是这么做的! 主要为大家介绍了为什么要做 A/B 测试、火山引擎的 A/B 测试系统架构及字节跳动内部 A/B 测试的最佳实践。 为什么要做 A/B 测试 首先我们看一个案例。 字节跳动有一款中视频产品叫西瓜视频,最早它叫做头条视频。为了提升产品的品牌辨识度,团队想给它起个更好的名字。经过一些内部调研和头脑风暴, 阅读全文
posted @ 2022-01-17 14:24 字节跳动数据平台 阅读(7609) 评论(2) 推荐(2)
摘要: 深度介绍Flink在字节跳动数据流的实践 本文是字节跳动数据平台开发套件团队在1月9日Flink Forward Asia 2021: Flink Forward 峰会上的演讲分享,将着重分享Flink在字节跳动数据流的实践。 字节跳动数据流的业务背景 数据流处理的主要是埋点日志。埋点,也叫Event Tracking,是数据和业务之间的桥 阅读全文
posted @ 2022-01-12 13:10 字节跳动数据平台 阅读(2537) 评论(1) 推荐(4)
摘要: 注意,你所做的 A/B 实验,可能是错的! 对于 A/B 实验原理认知的缺失,致使许多企业在业务增长的道路上始终在操作一批“错误的 A/B 实验”。这些实验并不能指导产品的优化和迭代,甚至有可能与我们的初衷背道而驰,导致“负增长”。 在 A/B 实验不断走红的今天,越来越多的企业开始意识到 A/B 实验的重要意义,并试图通过 A/B 实验,前 阅读全文
posted @ 2022-01-10 14:20 字节跳动数据平台 阅读(2361) 评论(1) 推荐(2)
摘要: 在字节跳动内部,Presto 主要支撑了 Ad-hoc 查询、BI 可视化分析、近实时查询分析等场景,日查询量接近 100 万条。 阅读全文
posted @ 2022-01-07 17:32 字节跳动数据平台 阅读(825) 评论(0) 推荐(0)
上一页 1 ··· 47 48 49 50 51