Postgresql Checkpoint 原理

前言

postgresql 的 checkpoint 是数据库中非常重要的部分，它涉及到数据库的缓存，持久化与数据恢复各个方面。它在执行时会涉及到大量磁盘 IO，所以对于它的优化和监控是不可缺少的。此篇文章讲述了 checkpoint 的原理及其监控，这对调优会有很大的帮助。

Checkpoint 简介

postgresql 会将数据持久化到磁盘里，不过因为磁盘的读写性能比较差，所以又添加了一层缓存。这样每次的数据读写都会优先在缓存中处理，如果数据不存在缓存中，才会从磁盘查找。虽然这样很大的提升了性能，但是缓存不具有磁盘的持久性，在机器断电时就会丢失。

postgresql 为了解决这个问题，结合了磁盘顺序写的特点，引入了 wal 日志机制。当每次数据修改时，还会记录一条日志存储在 wal 文件里，日志包含了此次修改的数据。wal 数据采用添加写的方式，能够充分利用顺序写高效的特点。这样即使数据库意外退出，也能利用 wal 来恢复数据。

当数据库重启时，只需要重放之前所有的wal 日志。不过 wal 日志随着时间的积累会变得非常大，会导致恢复的时间很长。针对这个问题，postgresql 提供了checkpoint 机制，会定期将缓存刷新到磁盘。数据的恢复也只需要从刷新点开始重放 wal 日志，并且之前的 wal 日志就不再有用，可以被回收。

触发条件

checkpoint 的触发条件分为下面多种。

时间触发：后台 checkpoint 进程会定时检查时间，如果距离上次 checkpoint 执行开始时的间隔超过了指定值，就会触发 checkpoint。这个指定值是配置文件的checkpoint_timeout 值，范围在 30s ~ 1 day，默认值为300s。

wal日志：当最新的 wal 日志，和上次 checkpoint 的刷新点的距离大于指定值，就会触发 checkpoint。触发值的大小在下面介绍checkpoint_complete_target会提到。

手动触发：当用户执行checkpoint命令也会触发，这个命令必须由超级用户才能执行。

数据库关闭：当数据库正常关闭时，会触发一次 checkpoint 。

基础备份：当进行数据基础备份时，会执行pg_start_backup命令，触发 checkpoint。

数据库崩溃修复：数据库异常退出后，比如数据库进程被kill -9，来不及清理操作。在重新启动时，会进行崩溃修复，修复完成后会触发 checkpoint。

posted @ 2021-04-06 17:54 邱明成阅读(904) 评论(0) 收藏举报

刷新页面返回顶部

邱明成

Postgresql Checkpoint 原理

前言

Checkpoint 简介

触发条件

公告