Linkis数据处理实战_ApacheCon_Asia演讲稿

背景

从事大数据开发,参与Linkis社区建设很长时间了,Beam 和 Hive Hook 血缘 搭建大数据平台

缺点

没有统一外部访问,形式比较单一
开发成本比较高,新手不容易扩展
元数据访问复杂

架构
在这里插入图片描述

选型

Apache Livy是一种通过REST接口与Spark集群轻松交互的服务。
Apache Zeppelin Web 的交互式数据分析 Notebook,聚焦于“扩展”能力
Netflix Geine 它是分布式作业编排引擎,聚焦于“管控”能力。强大的标签体系,支持按需路由作业到不同的 Hadoop 集群。
openLooKeng 它是一款高性能数据虚拟化引擎,提供统一 SQL 接口,具备跨数据源 / 数据中心分析能力。

Apache Linkis 在上层应用程序和底层引擎之间构建了一层计算中间件。

Linkis 构建解耦计算中间件层,具备连接、扩展、管理、编排和复用能力
金融级别框架,考虑情况比较综合。

  • 计算治理服务,支持计算任务/请求处理流程的3个主要阶段:提交->准备->执行;
  • 公共增强服务,包括上下文服务、物料管理服务及数据源服务等;
  • 微服务治理服务,包括定制化的Spring Cloud Gateway、Eureka、Open Feign。
  • 丰富的组件
  • 活跃的社区
posted @ 2022-07-22 17:40  Dlimeng  阅读(30)  评论(0)    收藏  举报  来源