传奇调查员之路：理智值-99，但我必须听懂深渊的语言

工程师技术深度之路 ———— 没法放弃去攀登最高的山和跨最宽的河

OS这条线

入口是《Systems Performance》Brendan Gregg著。不要被"性能"两个字误导，这本书的核心是用性能分析为线索，把OS的CPU调度、内存、I/O、网络全部串起来讲。那些读Netty时感受到的epoll、读RocketMQ时感受到的mmap/sendfile，在这本书里都有完整的OS视角解释。而且Gregg的写法是从现象到原理，和思维方式很匹配。
读完之后，epoll的边缘触发和水平触发、零拷贝的几种实现路径、page cache的工作方式，这些会从"我知道它存在"变成"我理解它为什么这样设计"。
补充一本更硬核的：《Linux Kernel Development》Robert Love著。如果Gregg读顺了，这本可以选择性啃，不用全读，挑调度器和内存管理两章就值回票价。

数据库这条线

既然《MySQL是怎样运行的》去过了，《高性能MySQL》第四版可以读，但建议把它当工具书而不是通读。
真正能让你上一个台阶的是CMU 15-445数据库课程，Andy Pavlo主讲，全部公开在YouTube和课程网站上。这门课是从零实现一个数据库内核——存储引擎、缓冲池、索引、并发控制、查询执行全部覆盖。读完你会理解为什么B+树长这样、为什么MVCC要这样设计，而不只是记住结论。配套有编程作业，做不做随你，但光看视频已经很值。

AI新底层这条线

这条线要分两层。
第一层是理解它能做什么和为什么，入口是Andrej Karpathy的《Neural Networks: Zero to Hero》，YouTube上全部公开。他从最简单的神经网络手写到GPT，代码量很小但每一步都讲清楚了为什么。有工程背景，这个系列会非常顺，大概两三周能看完。看完之后attention机制、tokenization、采样策略这些词就不再是黑箱了。
第二层是理解它作为基础设施的工程含义——推理延迟、KV cache、context window的本质限制、RAG vs 微调的取舍。这一层目前没有特别好的书，因为还在快速演进，最好的方式是读一手资料，Anthropic和OpenAI的技术博客，以及arxiv上的几篇关键论文：Attention is All You Need、FlashAttention、以及最近的一些推理优化论文。

一个顺序建议

OS和AI这两条可以并行，因为性质不同，OS是深挖，AI是建立新认知框架，不会互相干扰。数据库那条暂时放着，等OS这条走了一段再回来，你会发现很多东西突然打通了，比如InnoDB的buffer pool和OS的page cache本质上在解决同一个问题。
最后想说的是 AI是个独立的副本，不能错过，它不会替代和影响你已有的调查档案，但会是一个新的档案。

posted on 2026-06-02 11:20 幽州散人阅读(5) 评论(0) 收藏举报

刷新页面返回顶部

传奇调查员之路：理智值-99，但我必须听懂深渊的语言

OS这条线

数据库这条线

AI新底层这条线

一个顺序建议

导航

公告