Python 异步编程完全指南：从 asyncio 到高性能并发

在当今高并发的网络应用时代，同步阻塞的编程模型往往成为性能瓶颈。Python 的异步编程，特别是 asyncio 框架，为我们提供了一种高效的并发解决方案。它允许在单个线程中处理成千上万的并发连接，极大地提升了 I/O 密集型应用的吞吐量。

本文将带你从 asyncio 的基础概念出发，逐步深入，最终构建高性能的并发应用。

1. 异步编程的核心概念

在深入代码之前，理解几个核心概念至关重要：

协程 (Coroutine): 异步函数，使用 async def 定义。它是异步编程的基本单元，可以在执行时暂停 (await) 并在之后恢复。
事件循环 (Event Loop): 异步程序的“引擎”，负责调度和执行协程，处理 I/O 事件。
await 表达式: 用于挂起当前协程，等待一个可等待对象（如另一个协程、Task、Future）完成。
Task: 对协程的进一步封装，由事件循环调度，用于并发运行多个协程。

2. asyncio 入门：你的第一个异步程序

让我们从一个简单的例子开始，感受异步的“等待”而非“阻塞”。

import asyncio
import time

async def say_after(delay, what):
    """一个简单的异步函数，模拟耗时操作"""
    await asyncio.sleep(delay)  # 异步等待，而不是 time.sleep
    print(what)

async def main():
    print(f"程序开始于: {time.strftime('%X')}")

    # 顺序执行两个协程
    await say_after(1, '你好')
    await say_after(2, '世界')

    print(f"程序结束于: {time.strftime('%X')}")

# Python 3.7+ 运行 asyncio 程序的推荐方式
asyncio.run(main())

运行这段代码，你会发现总共耗时约 3 秒。这是因为 await 会等待当前协程完成，再执行下一个。这并没有实现并发。

3. 实现并发：创建 Task

要并发运行协程，我们需要将其包装成 Task。

import asyncio
import time

async def say_after(delay, what):
    await asyncio.sleep(delay)
    print(what)
    return f"{what} 完成"  # 协程可以返回值

async def main():
    print(f"程序开始于: {time.strftime('%X')}")

    # 创建两个 Task，它们会被事件循环并发调度
    task1 = asyncio.create_task(say_after(1, '你好'))
    task2 = asyncio.create_task(say_after(2, '世界'))

    # 等待两个 Task 完成，并获取结果
    result1 = await task1
    result2 = await task2

    print(f"结果: {result1}, {result2}")
    print(f"程序结束于: {time.strftime('%X')}")

asyncio.run(main())

这次，程序总耗时约 2 秒！task1 和 task2 几乎同时开始等待，实现了并发。asyncio.create_task() 是启动并发操作的关键。

小提示： 在开发调试异步程序时，清晰的日志和状态追踪非常重要。你可以使用像 dblens QueryNote 这样的在线 SQL 笔记工具来记录你的异步任务调度逻辑、API 调用链或数据库查询顺序，它能帮助你可视化复杂的并发执行路径，让调试过程更加直观。访问 https://note.dblens.com 了解更多。

4. 高级并发模式

4.1 等待多个任务：`asyncio.gather`

gather 用于并发运行多个可等待对象，并收集它们的结果。

import asyncio

async def fetch_data(id, delay):
    print(f"任务 {id} 开始")
    await asyncio.sleep(delay)
    print(f"任务 {id} 结束")
    return {"id": id, "data": f"来自任务{id}"}

async def main():
    # 并发执行三个任务，并等待所有完成
    results = await asyncio.gather(
        fetch_data(1, 2),
        fetch_data(2, 1),
        fetch_data(3, 3),
    )
    print("所有任务结果:", results)

asyncio.run(main())

4.2 超时与防护：`asyncio.wait_for` 和 `asyncio.shield`

import asyncio

async def slow_operation():
    await asyncio.sleep(5)
    return "操作完成"

async def main():
    try:
        # 为协程设置 2 秒超时
        result = await asyncio.wait_for(slow_operation(), timeout=2.0)
        print(result)
    except asyncio.TimeoutError:
        print("操作超时！")

    # asyncio.shield 可以防止任务被取消（除非显式取消）
    task = asyncio.create_task(slow_operation())
    shielded_task = asyncio.shield(task)
    # ... 其他可能取消 shielded_task 的代码

asyncio.run(main())

5. 实战：高性能异步 HTTP 客户端

结合 aiohttp 库，我们可以轻松构建高性能的并发 HTTP 客户端。

import aiohttp
import asyncio
import time

async def fetch_url(session, url):
    """异步获取单个URL的内容"""
    async with session.get(url) as response:
        # 注意：这里我们只读取一小部分内容作为演示
        text = await response.text()
        return f"{url}: 状态 {response.status}, 长度 {len(text)}"

async def main():
    urls = [
        "https://httpbin.org/delay/1",
        "https://httpbin.org/delay/2",
        "https://httpbin.org/delay/1",
        "https://httpbin.org/status/404",
    ] * 3  # 重复几次以增加并发量

    async with aiohttp.ClientSession() as session:
        tasks = [fetch_url(session, url) for url in urls]
        # 使用 gather 并发发起所有请求
        results = await asyncio.gather(*tasks, return_exceptions=True)

        for r in results:
            if isinstance(r, Exception):
                print(f"请求出错: {r}")
            else:
                print(r)

if __name__ == "__main__":
    start = time.time()
    asyncio.run(main())
    print(f"总耗时: {time.time() - start:.2f} 秒")

这个程序并发请求多个有延迟的 URL，总耗时远小于顺序请求的总和。

性能优化提示： 在高并发场景下，数据库常常成为瓶颈。使用异步数据库驱动（如 asyncpg for PostgreSQL, aiomysql for MySQL）是第一步。更进一步，你可以利用 dblens SQL 编辑器 来分析你的异步应用产生的数据库查询。它的可视化执行计划、性能分析和查询历史对比功能，能帮助你精准定位慢查询，优化索引策略，确保你的异步应用后端也能全速运行。立即体验：https://www.dblens.com。

6. 常见陷阱与最佳实践

不要混用阻塞与异步代码： 在协程内使用 time.sleep() 或执行 CPU 密集型计算会阻塞整个事件循环。对于 CPU 密集型任务，使用 asyncio.to_thread() 或 concurrent.futures.ProcessPoolExecutor 将其转移到其他线程/进程。
正确处理异常： 使用 try...except 捕获协程内的异常，或使用 gather(..., return_exceptions=True) 收集异常。
理解“异步上下文”： 很多操作（如文件 I/O）需要特定的异步版本库（如 aiofiles）。
避免创建“孤儿”Task： 确保所有创建的 Task 都被妥善等待或取消，防止资源泄漏。

总结

Python 的异步编程通过 asyncio 框架，为我们提供了一套强大且高效的并发编程模型。从理解协程、事件循环和 Task 的基本概念开始，到使用 create_task、gather、wait_for 等工具构建并发逻辑，再到结合 aiohttp 等生态库进行实战开发，这条学习路径能帮助你逐步掌握构建高性能网络应用的技能。

记住，异步编程的核心思想是 “在等待 I/O 时去做别的事” 。合理运用它，可以让你用更少的资源（如线程/进程）服务更多的并发连接。同时，借助像 dblens 系列工具这样的专业数据库开发平台，你能更好地监控和优化应用的全链路性能，从而打造出真正健壮、高效的后端服务。

异步之路，始于 asyncio，但远不止于此。继续探索 anyio, trio 等更高级的异步框架，将使你的并发编程能力更上一层楼。

posted on 2026-02-01 21:26 DBLens数据库开发工具阅读(0) 评论(0) 收藏举报

刷新页面返回顶部