12 想更进一步的人该怎么学: 存储、内核与源码阅读路径

很多人学 PostgreSQL，到会写 SQL、会建索引、会查慢查询这一步就停下来了。其实再往前走一步，你会发现真正决定判断力的，往往不是你背了多少命令，而是你是否理解数据库内部大致怎么运作。因为线上很多复杂问题，最终都要回到内部机制来解释。

先建立地图，再进源码

直接从源码第一行开始看，通常效率不高。更好的方法是先建立 PostgreSQL 的运行地图。

一条 SQL 请求大致会经过这些阶段:

你不需要一开始就掌握每个细节，但至少要知道自己当前在看的是哪一层。

这是理解长事务、膨胀、vacuum、锁等待、快照开销的基础。

这是理解“为什么不走你以为该走的索引”的关键。

这是理解节点如何真正工作、为什么某些计划在实际运行时特别慢的关键。

这是理解写放大、恢复、检查点、缓冲命中和 I/O 行为的关键。

推荐顺序:

例如:

这样学，源码就不是抽象负担，而是现实问题的解释器。

教材里的数据库原理是“理想模型”，而真实 PostgreSQL 内核是“工程系统”。工程系统一定有历史包袱、性能折中、兼容性权衡。你真正要学的，不只是某个函数干了什么，而是一个成熟数据库如何在正确性、性能、可维护性之间做平衡。

这一步最容易真正长能力，因为你会开始把“日志里的一行异常”“计划中的一个节点”“等待链中的一个会话”映射到 PostgreSQL 的内部机制上。

因为会用 PostgreSQL 和真正理解 PostgreSQL，中间差的往往不是知识量，而是视角。只要你的视角从“数据库是个黑箱”变成“数据库是一套可以逐层理解的系统”，很多原本看起来神秘的问题，都会慢慢变成可以推理、可以验证、可以复盘的问题。

这就是学习内核和源码最核心的回报。