《深入 Django ORM:select_related 与 prefetch_related 的实战剖析与性能优化指南》

一、引言:从 ORM 到性能优化,Django 的数据之道

在 Python Web 开发领域,Django 以其“全家桶”架构著称,其中 ORM(对象关系映射)是连接数据库与业务逻辑的关键桥梁。它让我们用 Python 类和对象操作数据库,极大提升了开发效率与代码可读性。

但 ORM 并非魔法,它背后仍是 SQL 查询。若使用不当,尤其在处理关联模型时,容易陷入经典的性能陷阱——N+1 查询问题。

本文将深入讲解 Django ORM 中的两个重要优化工具:select_relatedprefetch_related,帮助你写出更高效、更优雅的数据库访问代码。


二、背景介绍:Django ORM 的演进与挑战

Django ORM 让开发者可以:

  • 用 Python 类定义数据模型。
  • 自动生成数据库表结构。
  • 使用链式查询操作数据库。
  • 通过关联字段访问外键、反向关系等复杂结构。

然而,随着业务复杂度提升,模型之间的关系也愈加紧密。一个页面可能涉及多个模型的嵌套查询,若不加优化,ORM 会在后台执行大量 SQL,导致性能急剧下降。

这就是 N+1 查询问题的由来。


三、什么是 N+1 查询问题?

假设我们有如下两个模型:

class Author(models.Model):
name = models.CharField(max_length=100)
class Book(models.Model):
title = models.CharField(max_length=100)
author = models.ForeignKey(Author, on_delete=models.CASCADE)

现在我们想获取所有书籍及其作者名称:

books = Book.objects.all()
for book in books:
print(book.title, book.author.name)

这段代码看似简单,但实际上:

  • 第一次查询:获取所有 Book(1 次 SQL)。
  • 每次访问 book.author 时:执行一次 SQL 查询 Author