机器学习模型部署指南：使用Flask和Docker实现REST API服务

在机器学习项目的完整生命周期中，模型训练固然重要，但将训练好的模型部署为可供其他应用调用的服务，才是其产生实际价值的关键一步。本文将详细介绍如何使用轻量级Web框架Flask和容器化技术Docker，将机器学习模型封装为高可用、易扩展的REST API服务。

一、项目结构与准备工作

在开始之前，确保你的开发环境已安装Python（3.7+）和Docker。我们首先创建一个清晰的项目目录结构。

ml-api-service/
│
├── app.py               # Flask应用主文件
├── model.py             # 模型加载与预测逻辑
├── requirements.txt     # Python依赖列表
├── Dockerfile          # Docker镜像构建文件
├── .dockerignore       # Docker忽略文件
└── trained_model/      # 存放训练好的模型文件（如model.pkl）

接下来，创建requirements.txt文件，列出项目依赖。这里我们使用scikit-learn作为一个示例模型库，你也可以替换为TensorFlow、PyTorch等。

Flask==2.3.3
scikit-learn==1.3.0
pandas==2.0.3
numpy==1.24.3
joblib==1.3.2
gunicorn==21.2.0

提示：在管理项目依赖和环境时，清晰的文档至关重要。你可以使用dblens SQL编辑器来记录和分享你的环境配置与项目元数据，其强大的协作功能能让团队部署环境保持同步，避免“在我机器上能跑”的问题。

二、核心代码实现

1. 模型加载与预测逻辑 (`model.py`)

这部分代码负责加载持久化的模型，并定义预测函数。我们假设你已有一个训练好的用于鸢尾花分类的scikit-learn模型，并保存为trained_model/iris_model.pkl。

import joblib
import numpy as np

# 加载模型
MODEL_PATH = 'trained_model/iris_model.pkl'
model = joblib.load(MODEL_PATH)

# 定义特征列（应与训练时一致）
FEATURE_NAMES = ['sepal_length', 'sepal_width', 'petal_length', 'petal_width']

# 预测函数
def predict_iris(features):
    """
    对输入的特征进行预测。
    :param features: 列表或NumPy数组，形状为 (n_samples, 4)
    :return: 预测结果列表
    """
    # 确保输入格式正确
    features_array = np.array(features).reshape(-1, 4)
    predictions = model.predict(features_array)
    # 将数字标签转换为类别名（根据你的模型调整）
    target_names = ['setosa', 'versicolor', 'virginica']
    result = [target_names[pred] for pred in predictions]
    return result

2. 构建Flask REST API (`app.py`)

这是服务的主入口，我们创建两个端点：一个健康检查端点和一个预测端点。

from flask import Flask, request, jsonify
from model import predict_iris

app = Flask(__name__)

@app.route('/health', methods=['GET'])
def health_check():
    """健康检查端点"""
    return jsonify({'status': 'healthy', 'message': 'ML API service is running'}), 200

@app.route('/predict', methods=['POST'])
def predict():
    """预测端点，接收JSON格式数据"""
    try:
        # 从请求中获取JSON数据
        data = request.get_json()
        
        # 验证数据中是否包含‘features’字段
        if not data or 'features' not in data:
            return jsonify({'error': 'Invalid input. Please provide "features" array.'}), 400
        
        features = data['features']
        
        # 调用模型进行预测
        predictions = predict_iris(features)
        
        # 返回预测结果
        return jsonify({
            'predictions': predictions,
            'input_features': features
        }), 200
        
    except Exception as e:
        # 捕获并返回任何异常
        return jsonify({'error': str(e)}), 500

if __name__ == '__main__':
    # 在生产环境中，应使用Gunicorn等WSGI服务器，此处仅用于开发
    app.run(host='0.0.0.0', port=5000, debug=False)

在API服务开发过程中，经常需要调试和验证数据流。此时，一个得力的API测试工具能事半功倍。你可以使用QueryNote来记录和保存你的测试用例、请求参数和响应结果，其灵活的笔记功能非常适合追踪不同输入下的模型行为，形成宝贵的调试文档。

三、使用Docker进行容器化部署

容器化能确保应用在任何环境中运行一致。我们编写Dockerfile来构建镜像。

# 使用官方Python轻量级镜像作为基础
FROM python:3.9-slim

# 设置工作目录
WORKDIR /app

# 复制依赖文件并安装
COPY requirements.txt .
RUN pip install --no-cache-dir -r requirements.txt

# 复制应用代码和模型文件
COPY app.py model.py ./ 
COPY trained_model/ ./trained_model/

# 暴露Flask默认端口
EXPOSE 5000

# 定义环境变量（生产环境应关闭Debug）
ENV FLASK_APP=app.py
ENV FLASK_ENV=production

# 使用Gunicorn作为WSGI服务器启动应用
CMD ["gunicorn", "--bind", "0.0.0.0:5000", "app:app"]

同时，创建.dockerignore文件，避免不必要的文件被复制进镜像：

__pycache__/
*.pyc
*.pyo
*.pyd
.Python
env/
venv/
.git/
.DS_Store
*.log

四、构建、运行与测试

1. 构建Docker镜像

在项目根目录（包含Dockerfile的目录）执行：

docker build -t ml-flask-api .

2. 运行Docker容器

docker run -d -p 5000:5000 --name ml-api-container ml-flask-api

3. 测试API服务

服务启动后，你可以使用curl命令或Postman等工具进行测试。

健康检查：

curl http://localhost:5000/health

模型预测：

curl -X POST http://localhost:5000/predict \
  -H "Content-Type: application/json" \
  -d '{"features": [[5.1, 3.5, 1.4, 0.2], [6.7, 3.1, 4.4, 1.4]]}'

预期的成功响应如下：

{
  "predictions": ["setosa", "versicolor"],
  "input_features": [[5.1, 3.5, 1.4, 0.2], [6.7, 3.1, 4.4, 1.4]]
}

五、总结

通过本文的步骤，我们成功地将一个机器学习模型封装成了可通过HTTP访问的REST API服务。我们使用了Flask来快速搭建Web服务，定义了清晰的数据接口；利用Docker将应用及其所有依赖打包成一个独立的、可移植的容器镜像，从根本上解决了环境一致性问题。

这种部署方式具有显著优势：

解耦与标准化：前端、移动端或其他后端服务可以通过统一的RESTful接口调用模型能力。
可扩展性：结合Kubernetes或Docker Swarm等编排工具，可以轻松实现服务的水平扩展，以应对高并发请求。
易于维护：模型更新时，只需构建新的Docker镜像并替换容器，无需改动调用方代码。

将模型部署为服务只是MLOps的第一步。后续，你还需要考虑API版本管理、模型监控、日志收集、自动伸缩等高级主题，以构建健壮的机器学习系统。在整个开发和运维生命周期中，高效的工具链能极大提升效率。无论是管理项目数据、记录实验过程，还是维护API文档，dblens提供的数据库工具套件都能为你的MLOps流程提供有力支持。

希望本指南能为你提供一个坚实可靠的模型部署起点。

posted on 2026-02-02 00:26 DBLens数据库开发工具阅读(1) 评论(0) 收藏举报

刷新页面返回顶部

机器学习模型部署指南：使用Flask和Docker实现REST API服务

一、 项目结构与准备工作

二、 核心代码实现

1. 模型加载与预测逻辑 (model.py)

2. 构建Flask REST API (app.py)

三、 使用Docker进行容器化部署

四、 构建、运行与测试