airflow部署安装记录日志

前言

Airflow 是 Apache 基金会开源的工作流编排与调度工具,核心价值是将复杂的ETL、数据分析、自动化任务拆解为可调度、可监控、可重试的任务流(DAG)。简单来说,前辈造了一个好用的工具,又可以踩在巨人的肩膀上了。本文写于2025年11月,基于 Airflow 2.9.2(主流稳定版本),从环境搭建到登录成功,仅供参考。如果你读到本文的时间已经过了很久,请参考当时最新的版本。

一、环境搭建

1.前置配件

  •   python:3.12.12
  •   airflow:2.9.2
  •   Ubuntu 25.10
  •   Anaconda 25.1.1 

2.开始安装

(1). 安装 Airflow(指定 2.9.x 稳定版本)
pip install "apache-airflow==2.9.2" --constraint "https://raw.githubusercontent.com/apache/airflow/constraints-2.9.2/constraints-3.8.txt"

加上约束能强制包之间的依赖正确。但是没访问到,于是改成如下,从清华镜像源下载:

pip install "apache-airflow==2.9.2" -i https://pypi.tuna.tsinghua.edu.cn/simple

会安装一大堆的包,最后总结一下都安装了什么包。

(2). 初始化数据库(默认 SQLite)
airflow db init

执行以上命令会初始化数据库,方便使用,当你看到下图字样,就是初始化成功了。

image

 

 分支剧情:

  如果在当前步骤,或者其他步骤提示你数据库缺少什么表,或者其他数据库问题。请尝试重置命令:

  airflow db reset

  执行完会删除db,然后再次执行初始化即可。

(3). 启动 Web 服务(默认端口 8080)和调度器
airflow webserver --port 8080 -D # 后台运行
airflow scheduler -D # 后台运行

启动过程,看到这个页面,你基本可以拍大腿欢呼了

image

 

一切正常,你可以看到登录页面如下:

image

 

         看到左上角的图标,想必Airbnb团队也是喜欢看大风车动画片的。

(4). 创建管理员用户
airflow users create \
--username admin \
--password 123456 \
--firstname Admin \
--lastname User \
--role Admin \
--email admin@nihao.com

 

(5)登录UI

浏览器访问 :  http://localhost:8080  ,用以上创建的用户登录,即可看到首页页面

image

 

 

二、核心知识

  学习大风车动画的核心内容,开启你的冒险之旅

 

image

 




参考链接:https://blog.csdn.net/2408_89348881/article/details/155282560

posted @ 2025-11-29 21:50  llkingangle  阅读(0)  评论(0)    收藏  举报