传奇调查员之路:理智值-99,但我必须听懂深渊的语言

工程师技术深度之路 ———— 没法放弃去攀登最高的山和跨最宽的河
ChatGPT Image 2026年6月2日 11_33_28

OS这条线

入口是《Systems Performance》Brendan Gregg著。不要被"性能"两个字误导,这本书的核心是用性能分析为线索,把OS的CPU调度、内存、I/O、网络全部串起来讲。那些读Netty时感受到的epoll、读RocketMQ时感受到的mmap/sendfile,在这本书里都有完整的OS视角解释。而且Gregg的写法是从现象到原理,和思维方式很匹配。
读完之后,epoll的边缘触发和水平触发、零拷贝的几种实现路径、page cache的工作方式,这些会从"我知道它存在"变成"我理解它为什么这样设计"。
补充一本更硬核的:《Linux Kernel Development》Robert Love著。如果Gregg读顺了,这本可以选择性啃,不用全读,挑调度器和内存管理两章就值回票价。

数据库这条线

既然《MySQL是怎样运行的》去过了,《高性能MySQL》第四版可以读,但建议把它当工具书而不是通读。
真正能让你上一个台阶的是CMU 15-445数据库课程,Andy Pavlo主讲,全部公开在YouTube和课程网站上。这门课是从零实现一个数据库内核——存储引擎、缓冲池、索引、并发控制、查询执行全部覆盖。读完你会理解为什么B+树长这样、为什么MVCC要这样设计,而不只是记住结论。配套有编程作业,做不做随你,但光看视频已经很值。

AI新底层这条线

这条线要分两层。
第一层是理解它能做什么和为什么,入口是Andrej Karpathy的《Neural Networks: Zero to Hero》,YouTube上全部公开。他从最简单的神经网络手写到GPT,代码量很小但每一步都讲清楚了为什么。有工程背景,这个系列会非常顺,大概两三周能看完。看完之后attention机制、tokenization、采样策略这些词就不再是黑箱了。
第二层是理解它作为基础设施的工程含义——推理延迟、KV cache、context window的本质限制、RAG vs 微调的取舍。这一层目前没有特别好的书,因为还在快速演进,最好的方式是读一手资料,Anthropic和OpenAI的技术博客,以及arxiv上的几篇关键论文:Attention is All You NeedFlashAttention、以及最近的一些推理优化论文。

一个顺序建议

OS和AI这两条可以并行,因为性质不同,OS是深挖,AI是建立新认知框架,不会互相干扰。数据库那条暂时放着,等OS这条走了一段再回来,你会发现很多东西突然打通了,比如InnoDB的buffer pool和OS的page cache本质上在解决同一个问题。
最后想说的是 AI是个独立的副本,不能错过,它不会替代和影响你已有的调查档案,但会是一个新的档案。

posted on 2026-06-02 11:20  幽州散人  阅读(5)  评论(0)    收藏  举报

导航