国内大厂实时计算技术栈及经典案例

一、字节跳动 & 抖音‌

  1. ‌技术组合‌

    • ‌核心组件‌:Flink + Kafka + HBase‌
    • ‌辅助工具‌:Redis(实时缓存)、ClickHouse(实时分析)‌
  2. ‌经典案例‌

    • ‌抖音实时推荐系统‌:
      • 使用 Flink 处理用户行为数据流,结合 Kafka 实现高吞吐数据传输,实时计算用户兴趣标签并存储至 HBase,通过 Redis 提供毫秒级推荐响应‌
      • 支撑日均 4 亿用户实时互动,推荐准确率提升 30%‌

 

‌二、腾讯‌

  1. ‌技术组合‌

    • ‌核心组件‌:Flink + Kudu + Impala‌
    • ‌辅助工具‌:TDW(腾讯数仓)、Angel(图计算引擎)‌
  2. ‌经典案例‌

    • ‌腾讯看点实时数仓‌:
      • Flink 实时聚合用户点击、阅读数据并写入 Kudu,Impala 提供分钟级多维分析(如地域分布、内容热度),替代原离线数仓方案,延迟从 3-6 小时降至 5 分钟以内‌

 

‌三、百度‌

  1. ‌技术组合‌

    • ‌核心组件‌:Flink + Kafka + HBase‌
    • ‌辅助工具‌:Palo(Doris,实时 OLAP)‌
  2. ‌经典案例‌

    • ‌搜索实时排序优化‌:
      • 基于 Flink 实时处理用户搜索日志,结合 Kafka 传输实时特征数据,HBase 存储动态特征,支持搜索结果的实时个性化排序,响应延迟低于 500ms‌

四、阿里巴巴‌

  1. ‌技术组合‌

    • ‌核心组件‌:Flink + Kafka + Hologres‌
    • ‌辅助工具‌:MaxCompute(离线数仓)、Blink(Flink 定制版)‌
  2. ‌经典案例‌

    • ‌双十一实时大屏‌:
      • Flink 实时计算交易、支付数据,通过 Kafka 同步至 Hologres 存储,支撑每秒百万级 QPS 的实时大屏展示,延迟稳定在 1 秒内‌

五、美团‌

  1. ‌技术组合‌

    • ‌核心组件‌:Flink + Kafka + HBase‌
    • ‌辅助工具‌:Doris(实时 OLAP)、ManuGraph(图数据库)‌
  2. ‌经典案例‌

    • ‌外卖实时调度系统‌:
      • Flink 处理订单与骑手 GPS 数据流,结合 HBase 存储实时位置信息,动态优化配送路径,日均减少骑手绕行里程 15%‌

六、技术趋势与共性‌

  1. ‌流批一体架构‌:Flink 成为主流引擎,替代 Spark Streaming(仅批处理微批次)‌
  2. ‌实时数仓升级‌:Kudu + Impala、Hologres 、Kudu、Doris等组件逐步替代传统 Hive,支持实时更新与交互式查询‌
  3. ‌AI 融合‌:实时计算与隐私计算(如联邦学习)结合,提升数据安全性与模型实时性‌

posted @ 2025-03-27 10:36  业余砖家  阅读(450)  评论(0)    收藏  举报