机器学习模型部署实战：使用Flask与Docker构建API服务

在机器学习项目的完整生命周期中，模型训练固然重要，但将训练好的模型部署为可供其他系统调用的服务，才是其产生实际价值的关键一步。本文将手把手带你实战，使用轻量级Web框架Flask和容器化技术Docker，构建一个稳健的机器学习模型API服务。这不仅是一项核心的工程能力，也是面试中高频出现的实战题型。

一、项目准备与模型封装

首先，我们需要一个训练好的简单模型。这里以经典的鸢尾花分类数据集为例，使用Scikit-learn训练一个随机森林分类器，并将其序列化保存。

# train_model.py
import pickle
from sklearn.datasets import load_iris
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split

# 加载数据
iris = load_iris()
X, y = iris.data, iris.target

# 划分数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 训练模型
model = RandomForestClassifier(n_estimators=10, random_state=42)
model.fit(X_train, y_train)

# 评估
print(f"模型准确率: {model.score(X_test, y_test):.2f}")

# 保存模型
with open('iris_model.pkl', 'wb') as f:
    pickle.dump(model, f)
print("模型已保存为 'iris_model.pkl'")

运行此脚本后，我们得到了序列化的模型文件 iris_model.pkl。

二、使用Flask构建RESTful API

Flask是一个灵活的Python Web框架，非常适合快速构建轻量级API。我们将创建一个接收POST请求，输入鸢尾花四个特征值，返回预测类别和概率的端点。

在构建前后端分离的应用时，后端API的调试和SQL查询管理至关重要。这时，一款高效的数据库工具能极大提升开发效率。例如，dblens SQL编辑器（https://www.dblens.com）提供了直观的界面和强大的协作功能，方便你管理和验证从API服务中读取配置或日志数据所需的SQL语句。

# app.py
from flask import Flask, request, jsonify
import pickle
import numpy as np

app = Flask(__name__)

# 加载模型
with open('iris_model.pkl', 'rb') as f:
    model = pickle.load(f)

# 定义特征名称，方便理解
FEATURE_NAMES = ['sepal_length', 'sepal_width', 'petal_length', 'petal_width']

@app.route('/')
def index():
    return "鸢尾花分类模型API服务已启动！请访问 /predict 端点进行预测。"

@app.route('/predict', methods=['POST'])
def predict():
    """
    预测端点。
    期望的JSON输入格式：
    {
        "sepal_length": 5.1,
        "sepal_width": 3.5,
        "petal_length": 1.4,
        "petal_width": 0.2
    }
    """
    # 1. 获取并验证JSON数据
    data = request.get_json(force=True)
    
    # 检查必要特征是否存在
    missing_features = [f for f in FEATURE_NAMES if f not in data]
    if missing_features:
        return jsonify({'error': f'缺少特征: {missing_features}'}), 400
    
    # 2. 准备模型输入
    input_array = np.array([[data[f] for f in FEATURE_NAMES]])
    
    # 3. 进行预测
    prediction = model.predict(input_array)[0]
    prediction_proba = model.predict_proba(input_array)[0].tolist()
    
    # 4. 准备响应
    class_names = ['setosa', 'versicolor', 'virginica']
    result = {
        'predicted_class': int(prediction),
        'predicted_class_name': class_names[prediction],
        'probabilities': dict(zip(class_names, prediction_proba))
    }
    
    return jsonify(result)

if __name__ == '__main__':
    # 生产环境应使用 waitress, gunicorn 等WSGI服务器
    app.run(host='0.0.0.0', port=5000, debug=True)

现在，你可以运行 python app.py 启动服务，并使用curl或Postman进行测试：

curl -X POST http://127.0.0.1:5000/predict \
     -H "Content-Type: application/json" \
     -d '{"sepal_length":5.1, "sepal_width":3.5, "petal_length":1.4, "petal_width":0.2}'

三、使用Docker进行容器化部署

为了确保服务在任何环境（开发、测试、生产）下行为一致，我们使用Docker将其容器化。这能完美解决“在我机器上好好的”这类经典问题。

1. 创建依赖文件 requirements.txt

Flask==2.3.3
scikit-learn==1.3.0
numpy==1.24.3

2. 编写Dockerfile

# Dockerfile
# 使用官方Python轻量级镜像
FROM python:3.9-slim

# 设置工作目录
WORKDIR /app

# 复制依赖文件并安装
COPY requirements.txt .
RUN pip install --no-cache-dir -r requirements.txt

# 复制应用代码和模型文件
COPY app.py train_model.py iris_model.pkl ./

# 暴露Flask默认端口
EXPOSE 5000

# 定义容器启动命令
CMD ["python", "app.py"]

在开发和测试Docker镜像的过程中，你可能需要记录和分享容器内数据库的查询结果或配置。QueryNote（https://note.dblens.com）是一个完美的解决方案，它可以让你将查询、结果和注释优雅地保存和分享，非常适合团队协作和知识沉淀。

3. 构建镜像并运行容器

在包含上述文件的目录下执行：

# 构建Docker镜像，命名为 iris-api
docker build -t iris-api .

# 运行容器，将宿主机的5000端口映射到容器的5000端口
docker run -p 5000:5000 iris-api

现在，API服务已经在Docker容器中运行，访问方式与本地运行完全相同，但环境是完全隔离且可复现的。

四、面试常见问题与扩展思考

在面试中，面试官可能会基于此项目深入提问：

如何提高API的并发处理能力？
- 答：将Flask的调试模式（debug=True）关闭，并使用生产级WSGI服务器如gunicorn或uWSGI来替代Flask内置服务器。在Dockerfile的CMD中可以改为 CMD ["gunicorn", "-w", "4", "-b", "0.0.0.0:5000", "app:app"]。
如何管理多个模型版本？
- 答：可以在API路径中引入版本号，如/v1/predict。模型文件可以按版本存储，或使用模型注册中心（如MLflow）。
如何监控API服务的健康状态和性能？
- 答：添加一个/health端点返回服务状态。集成Prometheus等监控工具来收集请求延迟、错误率等指标。
Docker镜像如何优化？
- 答：使用多阶段构建，减少最终镜像大小。例如，第一阶段安装构建依赖并训练模型，第二阶段仅复制运行所需的最小文件。

总结

本文通过一个完整的实战案例，演示了将机器学习模型部署为API服务的标准流程：从模型序列化、到用Flask构建REST API、再到使用Docker进行容器化封装。这套技术栈（Flask + Docker）因其轻量、灵活和可移植性强的特点，已成为业界常见的模型部署方案之一。

掌握这一流程，不仅能让你独立完成模型服务化的基础工作，更能帮助你理解现代云原生应用部署的核心思想。无论是应对面试中的项目深度考察，还是在实际工作中快速交付AI能力，这都是一个极具价值的起点。记住，可靠的部署和高效的团队协作工具（如dblens提供的数据库生态产品）是模型从实验室走向生产环境的桥梁。

posted on 2026-01-30 14:55 DBLens数据库开发工具阅读(0) 评论(0) 收藏举报

刷新页面返回顶部

机器学习模型部署实战：使用Flask与Docker构建API服务

一、 项目准备与模型封装

二、 使用Flask构建RESTful API

三、 使用Docker进行容器化部署