Apache DolphinScheduler支持Flink吗？

随着大数据技术的快速发展，很多企业开始将Flink引入到生产环境中，以满足日益复杂的数据处理需求。而作为一款企业级的数据调度平台，Apache DolphinScheduler也跟上了时代步伐，推出了对Flink任务类型的支持。

Flink是一个开源的分布式流处理框架，具有高吞吐量、低延迟和准确性等特点，广泛应用于实时数据分析、机器学习等场景。通过DolphinScheduler的Flink任务类型，用户可以轻松地将Flink作业纳入到整个数据调度流程中，大大提高了数据处理的效率和可靠性。本文将介绍如何在DolphinScheduler中支持Flink节点，包括任务创建、设置等。

Flink节点

Flink 任务类型，用于执行 Flink 程序。对于 Flink 节点：

当程序类型为 Java、Scala 或 Python 时，worker 使用 Flink 命令提交任务 flink run。
当程序类型为 SQL 时，worker 使用sql-client.sh 提交任务。

创建任务

点击项目管理-项目名称-工作流定义，点击“创建工作流”按钮，进入 DAG 编辑页面；
拖动工具栏的任务节点到画板中。

任务参数

任务样例

执行 WordCount 程序

本案例为大数据生态中常见的入门案例，常应用于 MapReduce、Flink、Spark 等计算框架。主要为统计输入的文本中，相同的单词的数量有多少。

1.在 DolphinScheduler 中配置 Flink 环境

若生产环境中要是使用到 flink 任务类型，则需要先配置好所需的环境。配置文件如下：bin/env/dolphinscheduler_env.sh。

2.任务流程

上传主程序包

在使用 Flink 任务节点时，需要利用资源中心上传执行程序的 jar 包。

当配置完成资源中心之后，直接使用拖拽的方式，即可上传所需目标文件。

配置 Flink 节点

根据上述参数说明，配置所需的内容即可。

执行 FlinkSQL 程序

根据上述参数说明，配置所需的内容即可。

注意事项

Java 和 Scala 只是用来标识，没有区别，如果是 Python 开发的 Flink 则没有主函数的 class，其余的都一样。
使用 SQL 执行 Flink SQL 任务，目前只支持 Flink 1.13及以上版本。

原文链接：https://blog.csdn.net/zhengzaifeidelushang/article/details/136687233

本文由白鲸开源提供发布支持！

posted @ 2024-04-30 11:34 海豚调度阅读(924) 评论(0) 收藏举报

刷新页面返回顶部