apache spark conenct 提升spark 能力

spark 是一个很强大的工具,但是大家可能也会使用比较费事,包含了集群管理,以及多租户管理,所以社区开发了不少
基于spark 的扩展,apachekyuubi 就是一个典型提供了多租户以及直接使用sql 进行spark 操作的能力

原有spark 集成模式

 

 

新spark 集成模式

 

 

说明

apache spark conenct 利用了grpc 以及arrow 进行协议通信,这样以后我们开发基于spark 的处理就很简单了,从目前来说原有开源软件基于单体的模式都在向模块化
以及可灵活集成发现

参考资料

https://databricks.com/blog/2022/07/07/introducing-spark-connect-the-power-of-apache-spark-everywhere.html

posted on 2022-07-09 20:19  荣锋亮  阅读(114)  评论(0编辑  收藏  举报

导航