AI博客精选 -- 参见 https://github.com/joeseesun/ai-blog-res/

AI 研究者博客资源大全

精选全球顶级 AI 研究者博客与学习资源，助你快速掌握人工智能前沿动态。

一、个人技术博客

🏆 百科全书派（综述、知识体系化）

Lilian Weng - Lil'Log

机构：OpenAI | 方向：安全系统、RLHF、Agent
行业必读综述文献，体系化程度高，每篇相当于小综述
适合：研究员、技术负责人、需快速掌握领域全貌者
重点：AI代理架构、对抗攻击、幻觉问题、RLHF

Sebastian Ruder - ruder.io

机构：Cohere（前DeepMind） | 方向：NLP、多语言模型、迁移学习
NLP News 简报是行业标准，理论深度高
适合：NLP研究员、多语言模型开发者
重点：多任务学习、迁移学习、NLP前沿

Jay Alammar - The Illustrated AI Blog

机构：Cohere | 方向：可视化教学
图解式教学，全球公认最佳入门资源
适合：初学者、需要直观理解模型者
重点：Transformer图解、GPT图解、BERT图解

🔬 机制解释派（黑盒逆向、电路分析）

Chris Olah - Colah's Blog

机构：Anthropic | 方向：可解释性、神经网络可视化
深度学习的显微镜，连接数学抽象与视觉直觉
适合：AI安全研究员、理论物理背景学者
重点：回路分析、流形结构、研究债务

Neel Nanda - neelnanda.io

机构：DeepMind（前Anthropic） | 方向：机制可解释性、逆向工程
可解释性研究实战手册，有大量代码和练习
适合：AI安全研究员、深度学习原理探索者
重点：Grokking现象、感应头、TransformerLens

Jan Leike - Musings on the Alignment Problem

机构：独立（前OpenAI） | 方向：AI对齐、Superalignment
系统讨论对齐问题，直接表达研究者观点
适合：AI安全研究员、对齐研究者
重点：对齐税、最小可行对齐方案

Evan Hubinger - Alignment Forum

机构：Anthropic | 方向：内对齐、欺骗性对齐
对齐社区长篇blog，理论深度高
适合：AI安全研究员、对齐理论研究者
重点：内对齐、欺骗性对齐

Matthias Gerstgrasser - Personal Site

机构：OpenAI | 方向：多智能体学习、机制设计
聚焦AI与人/AI共存问题
适合：多智能体研究者、机制设计研究者
重点：多智能体系统、激励设计

🏗️ 架构扩展派（缩放定律、高效架构）

Jason Wei - jasonwei.net

机构：Meta（前OpenAI/Google Brain） | 方向：CoT、涌现能力、Scaling Laws
思维链与涌现能力布道者，连接缩放定律与 Prompt 工程
适合：模型算法研究员、Prompt工程师
重点：涌现现象、思维链机制、指令微调

Yi Tay - yitay.net

机构：DeepMind | 方向：高效Transformer、架构设计
架构师必读圣经，深刻洞察模型架构历史
适合：大模型架构师、基础设施工程师
重点：T5 vs GPT、归纳偏置、Scaling

Guillaume Lample - GitHub

机构：Mistral AI | 方向：高效模型、Chinchilla优化
小模型大能力教科书，高效派巅峰
适合：资源受限的研究者、创业公司
重点：Llama训练、RAG、数据最优比

Albert Q. Jiang - albertqjiang.github.io

机构：Mistral AI | 方向：数学推理、MoE模型
推理与效率的未来方向
适合：推理能力研究者、MoE开发者
重点：数学超智能、Mixtral、稀疏激活

Hyung Won Chung - GitHub/YouTube

机构：Meta（前OpenAI/Google） | 方向：指令微调、模型行为
理解微调本质必读
适合：模型训练工程师、微调研究者
重点：指令微调规模化、激励vs教导

Ashwin Vaswani - Personal Site

机构：DeepMind | 方向：多模态、医疗AI
Transformer发明者之一，追踪架构鼻祖足迹
适合：架构研究者、多模态开发者
重点：多模态融合、Speech2Face

Ilya Sutskever - cs.toronto.edu/~ilya

机构：SSI（前OpenAI） | 方向：深度学习理论、AGI安全
深度学习先驱，AlexNet共同作者，AGI路径探索者
适合：深度学习研究员、AGI研究者
重点：序列建模、无监督学习、AGI安全

Alex Krizhevsky - cs.toronto.edu/~kriz

机构：独立（前Google） | 方向：卷积神经网络、ImageNet
AlexNet作者，开启深度学习革命
适合：计算机视觉研究员、深度学习历史研究者
重点：AlexNet、CIFAR数据集、卷积网络

Demis Hassabis - DeepMind

机构：Google DeepMind | 方向：AGI、强化学习、神经科学
DeepMind创始人，AlphaGo之父，诺贝尔化学奖得主
适合：AGI研究者、强化学习研究员、跨学科研究者
重点：AlphaGo、AlphaFold、AGI路径

⚡ 高效工程派（量化、推理优化）

Tim Dettmers - timdettmers.com

机构：CMU/Allen Institute | 方向：量化、消费级硬件
贫穷研究者救星，消费级硬件运行大模型
适合：创业公司CTO、个人开发者
重点：QLoRA、GPU选购指南、模型压缩

Nelson Elhage - blog.nelhage.com

机构：Anthropic | 方向：系统工程、性能优化
系统工程师硬核指南，底层调试经验丰富
适合：训练集群维护者、推理优化工程师
重点：性能工程、GPU调试、大规模系统

Jeff Dean - research.google/people/jeff

机构：Google | 方向：大规模系统、分布式训练
Google AI基础设施领军人物，系统架构大师
适合：系统架构师、分布式训练工程师
重点：TensorFlow、大规模ML系统、TPU

🚀 应用落地派（MLOps、RAG、系统设计）

Andrej Karpathy - karpathy.github.io

机构：Eureka Labs（前OpenAI/Tesla） | 方向：深度学习教育、Software 2.0
直觉构建大师，通过代码和类比解释复杂概念
适合：工程师、深度学习入门者
重点：Software 2.0、RNN、反向传播、LLM心理学

Greg Brockman - blog.gregbrockman.com

机构：OpenAI | 方向：技术领导力、AI基础设施
基础设施与工程文化蓝本，记录OpenAI成长历程
适合：CTO、技术管理者、架构师
重点：技术领导力、ML转型、分布式系统

Chip Huyen - huyenchip.com

机构：Voltron Data | 方向：MLOps、实时ML
生产环境 ML 系统设计专家
适合：MLOps工程师、数据科学家
重点：数据漂移、特征存储、实时推理

Eugene Yan - eugeneyan.com

机构：Amazon | 方向：推荐系统、LLM应用
推荐系统与 LLM 工程落地
适合：推荐系统工程师、LLM应用开发者
重点：LLM-as-Judge、RAG设计模式

Sophia Yang - Medium

机构：Mistral AI | 方向：开发者关系、应用落地
开发者落地手册，实战教程丰富
适合：应用开发工程师、产品经理
重点：Mistral实战、RAG构建、函数调用

Ravi Theja - The Maximalists

机构：Mistral AI（顾问） | 方向：企业级RAG
专注企业级LLM应用实践
适合：企业AI工程师、RAG开发者
重点：GraphRAG、CorrectiveRAG、MoA

Max Mynter - The Maximalists (Substack)

机构：Mistral AI | 方向：职业发展、研究工程
从候选人视角讲如何进入顶级LLM实验室
适合：求职者、职业规划者
重点：研究工程师路径、心态分享

Yennie Jun - Art Fish Intelligence

机构：DeepMind | 方向：数据叙事、LLM行为
半生活半技术，数据叙事参考
适合：产品故事写作者、创意研究者
重点：自我数据分析、LLM创造力评测

🌐 开放科学派（开源、批判性思考）

Yann LeCun - yann.lecun.com

机构：Meta | 方向：世界模型、JEPA、开源哲学
了解"非主流"AGI路径，对 Scaling Laws 保持警惕
适合：学术研究员、开源社区成员
重点：世界模型、非自回归、开源哲学

François Chollet - Substack

机构：Google | 方向：深度学习局限、ARC挑战
反炒作哲学思考，批判性视角
适合：学术研究员、对主流路线持怀疑态度者
重点：推理与抽象、ARC基准、神经符号AI

Ross Girshick - rossgirshick.info

机构：Meta FAIR | 方向：计算机视觉、目标检测
多模态视觉基础，定义现代计算机视觉
适合：视觉研究员、多模态开发者
重点：R-CNN系列、SAM、视觉Transformer

Smitha Milli - smithamilli.com

机构：Meta FAIR | 方向：AI对齐、博弈论
社会技术视角补充，数学社会学视角
适合：AI伦理研究者、政策制定者
重点：对齐博弈、推荐系统社会动力学

David Ha - ōtoro

机构：Sakana AI（前Google Brain） | 方向：神经网络与艺术融合
实验型博客，代码+可视化+思想组合
适合：创意AI研究者、艺术与技术交叉者
重点：进化算法、神经网络艺术

Geoffrey Hinton - cs.toronto.edu/~hinton

机构：独立（前Google） | 方向：深度学习基础、反向传播、胶囊网络
深度学习教父，图灵奖得主，神经网络复兴推动者
适合：所有AI研究者、深度学习理论研究者
重点：反向传播、Dropout、胶囊网络、AI风险

Yoshua Bengio - yoshuabengio.org

机构：Mila/Montreal | 方向：深度学习理论、因果推理、AI安全
深度学习三巨头之一，图灵奖得主，因果AI倡导者
适合：深度学习研究员、因果推理研究者
重点：注意力机制、生成模型、因果AI、AI伦理

Fei-Fei Li - Stanford Profile

机构：Stanford/Google Cloud | 方向：计算机视觉、ImageNet、AI伦理
计算机视觉奠基人，ImageNet创建者，人本AI倡导者
适合：视觉研究员、AI伦理研究者、教育工作者
重点：ImageNet、视觉识别、AI人文关怀

二、中国 AI 研究者与团队

大厂团队

通义千问 - Qwen Blog

机构：阿里云 | 方向：开源大模型、多模态、长文本
国内顶级开源大模型，技术博客详尽
适合：中文NLP研究者、开源模型开发者
重点：Qwen系列、长文本处理、多模态融合

智谱AI - 技术博客

方向：GLM系列、CodeGeeX、CogView
ChatGLM 系列开源模型，代码生成与视觉生成
适合：中文大模型开发者、代码生成研究者
重点：GLM架构、代码生成、文生图

字节跳动AI Lab - Publications

方向：多模态、推荐系统、NLP
工业级AI应用，推荐系统与多模态前沿
适合：推荐系统工程师、多模态研究者
重点：推荐算法、视频理解、内容生成

MiniMax - MiniMax Blog

方向：语音生成、多模态交互
语音大模型与多模态交互创新
适合：语音AI研究者、多模态交互开发者
重点：语音合成、多模态对话、情感计算

创业公司

Kimi / 月之暗面 - Moonshot Blog

方向：超长上下文、推理优化
长文本处理领军者，200K+ 上下文窗口
适合：长文本应用开发者、对话系统研究者
重点：长上下文技术、推理优化、对话系统

深度求索 - DeepSeek Blog

方向：代码生成、MoE架构
代码能力强劲，MoE 架构创新
适合：代码生成研究者、MoE架构开发者
重点：DeepSeek Coder、MoE架构、推理优化

零一万物 - Yi Blog

方向：Yi系列模型、长上下文
李开复创立，Yi 系列高性能模型
适合：中英双语模型研究者、长文本开发者
重点：Yi模型架构、双语能力、长上下文

百川智能 - 官网

方向：开源基座模型、垂直领域应用
王小川创立，开源基座模型与行业应用
适合：垂直领域AI开发者、开源模型研究者
重点：Baichuan模型、领域适配、模型压缩

面壁智能 - ModelBest

方向：CPM系列、高效训练
清华系创业，CPM 系列模型与高效训练
适合：学术界转工业界研究者、高效训练研究者
重点：CPM模型、参数高效微调、知识蒸馏

阶跃星辰 - StepFun

方向：Step系列、数学推理
数学推理与科学计算能力突出
适合：数学推理研究者、科学计算开发者
重点：数学推理、科学问答、逻辑推理

海螺AI - MiniMax Hailuo

方向：视频生成、多模态内容
视频生成领域创新者
适合：视频生成研究者、内容创作者
重点：文生视频、视频理解、创意生成

暗礁AI - Dark Rocks AI

方向：Agent、工作流自动化
企业级AI Agent与自动化
适合：Agent开发者、企业AI应用工程师
重点：AI Agent、工作流、企业应用

循环智能 - Recurrent AI

方向：对话智能、销售AI
对话智能与销售场景AI应用
适合：对话系统开发者、销售AI研究者
重点：对话分析、销售智能、情感识别

衔远科技 - Xverse AI

方向：金融大模型、垂直领域
金融等垂直领域大模型专家
适合：金融AI开发者、垂直领域研究者
重点：金融NLP、风险控制、领域知识

澜舟科技 - Langboat

方向：企业级NLP、知识图谱
周明创立，企业级NLP解决方案
适合：企业NLP工程师、知识图谱开发者
重点：企业NLP、知识抽取、文本挖掘

三、公司官方博客

国际公司

OpenAI - openai.com/blog

特色：GPT系列、一手资讯
获取最新模型发布和技术解读
适合：所有AI从业者
重点：GPT技术解读、API更新、安全研究

Google DeepMind - deepmind.google/blog

特色：AI先驱、跨学科研究
基础研究突破，AlphaFold 等里程碑
适合：研究员、跨学科研究者
重点：强化学习、蛋白质预测、游戏AI

Anthropic - anthropic.com/blog

特色：AI对齐和安全
Constitutional AI、Claude 技术细节
适合：AI安全研究员、对齐研究者
重点：对齐技术、安全评估、可解释性

Meta AI - ai.meta.com/blog

特色：LLaMA系列、开源导向
开源模型发布、视觉研究
适合：开源社区、视觉研究者
重点：LLaMA、SAM、开源生态

Mistral AI - mistral.ai/news

特色：高效模型、欧洲视角
小模型高性能，MoE架构
适合：资源受限开发者、欧洲AI关注者
重点：Mistral模型、Mixtral、效率优化

Cohere - cohere.com/blog

特色：企业级NLP、RAG
企业级应用、RAG最佳实践
适合：企业AI开发者、RAG研究者
重点：企业NLP、RAG、语义搜索

Hugging Face - huggingface.co/blog

特色：开源社区、模型分享
开源生态中心，模型与数据集平台
适合：开源开发者、模型研究者
重点：Transformers库、模型部署、社区实践

Stability AI - stability.ai/blog

特色：开源生成模型、Stable Diffusion
图像生成领军者，开源生成模型
适合：图像生成研究者、创意AI开发者
重点：Stable Diffusion、图像生成、开源生成

Scale AI - scale.com/blog

特色：数据标注、RLHF
数据工程与RLHF实践
适合：数据工程师、RLHF研究者
重点：数据质量、RLHF、人类反馈

Together AI - together.ai/blog

特色：去中心化训练、开源模型
分布式训练与开源模型托管
适合：分布式训练研究者、开源开发者
重点：分布式训练、模型托管、开源协作

中国公司

阿里云 - developer.aliyun.com/group/ai

特色：通义系列、云原生AI
云端AI服务与通义系列模型
适合：云端AI开发者、企业AI应用者
重点：通义千问、PAI平台、云原生AI

腾讯AI Lab - ai.tencent.com

特色：游戏AI、多模态、NLP
游戏AI与多模态研究
适合：游戏AI研究者、多模态开发者
重点：游戏AI、混元模型、多模态

百度AI - ai.baidu.com

特色：文心系列、产业应用
文心大模型与产业AI应用
适合：产业AI开发者、中文NLP研究者
重点：文心一言、飞桨框架、产业AI

商汤科技 - sensetime.com

特色：计算机视觉、具身智能
视觉AI与具身智能领军者
适合：视觉AI研究者、机器人开发者
重点：计算机视觉、具身智能、自动驾驶

旷视科技 - research.megvii.com

特色：计算机视觉、检测识别
视觉检测与识别技术
适合：视觉算法工程师、检测识别研究者
重点：目标检测、人脸识别、视觉算法

四、学术机构

UC Berkeley BAIR - bair.berkeley.edu/blog

特色：学术前沿、跨领域研究
机器人、RL、NLP 等多领域覆盖
适合：学术研究者、博士生
重点：强化学习、机器人、多模态

Stanford HAI - hai.stanford.edu/news

特色：人本AI、AI伦理
以人为本的 AI 研究与政策
适合：AI伦理研究者、政策制定者
重点：AI伦理、人本AI、政策研究

MIT CSAIL - csail.mit.edu/news

特色：计算机科学前沿
MIT 计算机科学与 AI 实验室
适合：学术研究者、技术前沿探索者
重点：机器学习、机器人、系统

CMU AI Blog - blog.ml.cmu.edu

特色：机器学习理论与应用
CMU机器学习系博客
适合：机器学习研究者、理论研究者
重点：学习理论、优化、深度学习

Mila (Montreal) - mila.quebec/en/blog

特色：深度学习理论、因果推理
Bengio 领导的蒙特利尔AI研究所
适合：深度学习理论研究者、因果推理研究者
重点：深度学习理论、因果AI、生成模型

上海AI Lab - shlab.org.cn/news

特色：开源开放、书生系列
书生多模态大模型与开源生态
适合：开源研究者、多模态开发者
重点：书生模型、多模态、开源生态

清华AI研究院 - air.tsinghua.edu.cn

特色：中国AI学术前沿
清华AI研究与产业结合
适合：中国学术界、产学研结合者
重点：基础研究、产业应用、人才培养

北京大学AI研究院 - ai.pku.edu.cn

特色：跨学科AI研究
北大跨学科AI研究
适合：跨学科研究者、理论研究者
重点：AI理论、跨学科应用

Distill - distill.pub

特色：可视化学术、交互体验
交互式论文，可视化解释复杂概念
适合：视觉学习者、教育者
重点：可视化ML、交互式解释

Alignment Forum - alignmentforum.org

特色：AI对齐社区
对齐研究的核心讨论平台
适合：AI安全研究员
重点：对齐理论、安全研究

五、学习路径推荐

🌱 初学者（0-6个月）

基础概念：Jay Alammar 图解系列 → Chris Olah 可视化教程
代码实践：Andrej Karpathy 教程 → Hugging Face 文档
系统学习：Lilian Weng 综述 → Sebastian Ruder NLP News
中文资源：通义千问博客 → 智谱AI技术文档

🌿 进阶研究者（6-18个月）

架构深入：Yi Tay 架构分析 → Jason Wei 涌现能力
安全对齐：Chris Olah 可解释性 → Neel Nanda 机制解释
工程优化：Tim Dettmers 量化 → Chip Huyen MLOps
中文前沿：Qwen 技术博客 → DeepSeek MoE 架构

🌳 专家级（18个月+）

理论前沿：Geoffrey Hinton、Yoshua Bengio、Yann LeCun 三巨头
AGI探索：Ilya Sutskever、Demis Hassabis、François Chollet
对齐研究：Jan Leike、Evan Hubinger、Alignment Forum
产业实践：各大公司官方博客 → 创业公司技术博客

六、按角色推荐

AI 应用工程师

必读：Lilian Weng（全局认知）
精读：Sophia Yang、Eugene Yan（RAG/Agent构建）
参考：Tim Dettmers（部署成本优化）

模型算法研究员

必读：Yi Tay、Jason Wei（架构与Prompt范式）
精读：Chris Olah、Neel Nanda（理论突破线索）
参考：Albert Q. Jiang（推理能力边界）

技术管理者（CTO/VP）

必读：Greg Brockman、Chip Huyen（团队与基础设施）
精读：Yann LeCun、François Chollet（保持清醒认知）
参考：Sebastian Ruder（行业趋势追踪）

AI 安全研究员

必读：Chris Olah、Neel Nanda（可解释性）
精读：Jan Leike、Evan Hubinger（对齐理论）
参考：Nelson Elhage（系统安全）

创业公司技术负责人

必读：Tim Dettmers（资源优化）
精读：Guillaume Lample（高效模型）
参考：Yi Tay（算力战略）

学术界研究员

必读：Yann LeCun（非主流路径）
精读：François Chollet（批判性思考）
参考：Ross Girshick（视觉基础）

中文 NLP 研究者

必读：Qwen 团队（开源大模型）
精读：智谱AI、Kimi 团队（中文技术）
参考：字节 AI Lab（工业应用）

企业 AI 开发者

必读：Chip Huyen、Eugene Yan（MLOps）
精读：澜舟科技、循环智能（企业场景）
参考：衔远科技（垂直领域）

七、派别分类速查

百科全书派

核心关注：综述、知识体系化、前沿追踪
代表人物：Lilian Weng、Sebastian Ruder、Jay Alammar
适合读者：需要快速掌握领域全貌的研究员、技术负责人

机制解释派

核心关注：黑盒逆向、电路分析、顿悟现象
代表人物：Chris Olah、Neel Nanda、Jan Leike、Evan Hubinger
适合读者：AI安全研究员、理论物理背景学者、深度学习原理探索者

架构扩展派

核心关注：缩放定律、高效架构、算力优化
代表人物：Yi Tay、Jason Wei、Guillaume Lample、Ilya Sutskever、Demis Hassabis、Qwen团队
适合读者：大模型架构师、基础设施工程师、CTO

高效工程派

核心关注：量化、消费级硬件、推理优化
代表人物：Tim Dettmers、Nelson Elhage、Jeff Dean、面壁智能
适合读者：创业公司CTO、个人开发者、边缘计算工程师

开放科学派

核心关注：非自回归、视觉基础、开源哲学
代表人物：Yann LeCun、Ross Girshick、François Chollet、Geoffrey Hinton、Yoshua Bengio、Fei-Fei Li
适合读者：学术界研究员、对主流Transformer路线持怀疑态度的创新者

应用落地派

核心关注：MLOps、RAG、系统设计
代表人物：Chip Huyen、Eugene Yan、Sophia Yang、Andrej Karpathy、字节AI Lab
适合读者：应用开发工程师、产品经理、数据科学家

八、内容风格分类

系统性综述

代表：Lilian Weng、Sebastian Ruder
特点：阅读数十篇论文后整理成逻辑严密的长文，统一符号体系

可视化教学

代表：Chris Olah、Jay Alammar
特点：大量图解、交互式内容，直观解释复杂概念

代码驱动

代表：Andrej Karpathy、Neel Nanda
特点：通过代码片段和实现细节构建直觉

哲学思辨

代表：Yann LeCun、François Chollet、Geoffrey Hinton、Yoshua Bengio
特点：宏观视角、批判性思考、长期路线探讨

实战教程

代表：Sophia Yang、Eugene Yan、Chip Huyen、Qwen团队
特点：How-to文档、生产环境经验、工程最佳实践

职业反思

代表：Jason Wei、Max Mynter、Greg Brockman
特点：职业路径、人生选择、团队建设经验

硬核调试

代表：Nelson Elhage、Tim Dettmers、Jeff Dean
特点：底层系统问题、性能优化、硬件选型

艺术融合

代表：David Ha、Yennie Jun
特点：创意实验、数据叙事、跨界探索

学术严谨

代表：Fei-Fei Li、Ilya Sutskever、Geoffrey Hinton、Yoshua Bengio
特点：学术论文风格、理论深度、数学严谨

九、更新频率参考

高频更新

Lilian Weng、Sebastian Ruder、Eugene Yan、Qwen团队、智谱AI

定期发布高质量长文或简报

中频更新

Jason Wei、Yi Tay、Chip Huyen、字节AI Lab、Kimi团队

有重要研究或思考时更新

项目驱动

Chris Olah、Neel Nanda、深度求索、海螺AI

随研究项目发布深度文章

里程碑式

Andrej Karpathy、Yann LeCun、Geoffrey Hinton、Ilya Sutskever

重大观点或教程时更新

主页索引型

Guillaume Lample、Albert Q. Jiang、Ross Girshick、Alex Krizhevsky、Fei-Fei Li

主要作为论文和项目索引

官方公告

OpenAI、DeepMind、Anthropic、Meta AI、阿里云、腾讯AI Lab

产品发布、研究成果公告

十、地区分布

美国（硅谷）

OpenAI系、Anthropic系、Meta系、Stanford HAI

主流技术路线、规模化思维

美国（学术界）

UC Berkeley、MIT、CMU、Fei-Fei Li、Geoffrey Hinton

基础研究、理论创新

欧洲

Mistral AI团队（Guillaume Lample、Albert Q. Jiang）

高效务实、资源约束下创新

加拿大

Yoshua Bengio、Geoffrey Hinton、Ilya Sutskever、Mila

深度学习发源地、理论深度

英国

DeepMind、Demis Hassabis

AGI探索、跨学科研究

中国（大厂）

阿里云Qwen、腾讯AI Lab、百度AI、字节跳动

工业级应用、大规模部署

中国（创业）

智谱AI、月之暗面、百川智能、零一万物、面壁智能、阶跃星辰、深度求索

技术创新、垂直场景、开源生态

中国（学术）

清华AI研究院、北大AI研究院、上海AI Lab

学术前沿、产学研结合

跨机构流动

Jason Wei、Yi Tay、Neel Nanda、Ilya Sutskever

多元视角、跨公司经验对比

十一、快速链接汇总

十二、特殊主题资源

AI 安全与对齐

Alignment Forum - AI 对齐社区核心讨论平台
AI Safety Support - AI 安全职业与学习资源
80,000 Hours AI Safety - AI 安全职业指南

开源工具与平台

Hugging Face - 开源模型与数据集中心
Papers With Code - 论文代码实现索引
GitHub Trending AI - AI项目趋势

中文 AI 社区

机器之心 - 中文 AI 资讯与技术解读
AI科技评论 - 中文AI深度报道
PaperWeekly - 中文论文解读社区

视频教程

Andrej Karpathy YouTube - 深度学习教学视频
3Blue1Brown - 数学与神经网络可视化
Two Minute Papers - AI论文快速解读

持续学习建议

每周阅读：订阅 Sebastian Ruder 的 NLP News、Lilian Weng 的新文章
每月深入：精读 1-2 篇长文，做笔记和代码复现
每季度回顾：关注 OpenAI、DeepMind、Anthropic 的重大发布
关注中文生态：跟踪 Qwen、智谱、Kimi 等国内团队的技术进展
参与社区：Hugging Face、GitHub、Alignment Forum 等平台互动
批判性思考：阅读 Yann LeCun、François Chollet 等人的反思文章

最后更新：2025年12月4日

维护者：向阳乔木 | 🌐 www.qiaomu.ai | 🐦 @vista8

贡献：欢迎提交 PR 补充更多优质资源

精选全球顶级 AI 研究者博客与学习资源，助你快速掌握人工智能前沿动态。

一、个人技术博客

🏆 百科全书派（综述、知识体系化）

Lilian Weng - Lil'Log

机构：OpenAI | 方向：安全系统、RLHF、Agent
行业必读综述文献，体系化程度高，每篇相当于小综述
适合：研究员、技术负责人、需快速掌握领域全貌者

Sebastian Ruder - ruder.io

机构：Cohere（前DeepMind） | 方向：NLP、多语言模型、迁移学习
NLP News 简报是行业标准，理论深度高
适合：NLP研究员、多语言模型开发者

Jay Alammar - The Illustrated AI Blog

机构：Cohere | 方向：可视化教学
图解式教学，全球公认最佳入门资源
适合：初学者、需要直观理解模型者

🔬 机制解释派（黑盒逆向、电路分析）

Chris Olah - Colah's Blog

机构：Anthropic | 方向：可解释性、神经网络可视化
深度学习的显微镜，连接数学抽象与视觉直觉
适合：AI安全研究员、理论物理背景学者

Neel Nanda - neelnanda.io

机构：DeepMind（前Anthropic） | 方向：机制可解释性、逆向工程
可解释性研究实战手册，有大量代码和练习
适合：AI安全研究员、深度学习原理探索者

Jan Leike - Musings on the Alignment Problem

机构：独立（前OpenAI） | 方向：AI对齐、Superalignment
系统讨论对齐问题，直接表达研究者观点
适合：AI安全研究员、对齐研究者

🏗️ 架构扩展派（缩放定律、高效架构）

Jason Wei - jasonwei.net

机构：Meta（前OpenAI/Google Brain） | 方向：CoT、涌现能力、Scaling Laws
思维链与涌现能力布道者，连接缩放定律与 Prompt 工程
适合：模型算法研究员、Prompt工程师

Yi Tay - yitay.net

机构：DeepMind | 方向：高效Transformer、架构设计
架构师必读圣经，深刻洞察模型架构历史
适合：大模型架构师、基础设施工程师

Guillaume Lample - GitHub

机构：Mistral AI | 方向：高效模型、Chinchilla优化
小模型大能力教科书，高效派巅峰
适合：资源受限的研究者、创业公司

⚡ 高效工程派（量化、推理优化）

Tim Dettmers - timdettmers.com

机构：CMU/Allen Institute | 方向：量化、消费级硬件
贫穷研究者救星，消费级硬件运行大模型
适合：创业公司CTO、个人开发者

Nelson Elhage - blog.nelhage.com

机构：Anthropic | 方向：系统工程、性能优化
系统工程师硬核指南，底层调试经验丰富
适合：训练集群维护者、推理优化工程师

🚀 应用落地派（MLOps、RAG、系统设计）

Andrej Karpathy - karpathy.github.io

机构：Eureka Labs（前OpenAI/Tesla） | 方向：深度学习教育、Software 2.0
直觉构建大师，通过代码和类比解释复杂概念
适合：工程师、深度学习入门者

Chip Huyen - huyenchip.com

机构：Voltron Data | 方向：MLOps、实时ML
生产环境 ML 系统设计专家
适合：MLOps工程师、数据科学家

Eugene Yan - eugeneyan.com

机构：Amazon | 方向：推荐系统、LLM应用
推荐系统与 LLM 工程落地
适合：推荐系统工程师、LLM应用开发者

Sophia Yang - Medium

机构：Mistral AI | 方向：开发者关系、应用落地
开发者落地手册，实战教程丰富
适合：应用开发工程师、产品经理

🌐 开放科学派（开源、批判性思考）

Yann LeCun - yann.lecun.com

机构：Meta | 方向：世界模型、JEPA、开源哲学
了解"非主流"AGI路径，对 Scaling Laws 保持警惕
适合：学术研究员、开源社区成员

François Chollet - Substack

机构：Google | 方向：深度学习局限、ARC挑战
反炒作哲学思考，批判性视角
适合：学术研究员、对主流路线持怀疑态度者

David Ha - ōtoro

机构：Sakana AI（前Google Brain） | 方向：神经网络与艺术融合
实验型博客，代码+可视化+思想组合
适合：创意AI研究者、艺术与技术交叉者

👑 深度学习先驱

Geoffrey Hinton - cs.toronto.edu/~hinton

深度学习教父，图灵奖得主，神经网络复兴推动者
重点：反向传播、Dropout、胶囊网络、AI风险

Yoshua Bengio - yoshuabengio.org

深度学习三巨头之一，图灵奖得主，因果AI倡导者
重点：注意力机制、生成模型、因果AI、AI伦理

Ilya Sutskever - cs.toronto.edu/~ilya

深度学习先驱，AlexNet共同作者，AGI路径探索者
重点：序列建模、无监督学习、AGI安全

Fei-Fei Li - Stanford Profile

ImageNet创建者，人本AI倡导者
重点：ImageNet、视觉识别、AI人文关怀

Demis Hassabis - DeepMind

DeepMind创始人，AlphaGo之父，诺贝尔化学奖得主

二、中国 AI 研究者与团队

大厂团队

通义千问 - Qwen Blog

机构：阿里云 | 方向：开源大模型、多模态、长文本
国内顶级开源大模型，技术博客详尽

智谱AI - 技术博客

方向：GLM系列、CodeGeeX、CogView
ChatGLM 系列开源模型，代码生成与视觉生成

字节跳动AI Lab - Publications

方向：多模态、推荐系统、NLP
工业级AI应用，推荐系统与多模态前沿

创业公司

Kimi / 月之暗面 - Moonshot Blog

方向：超长上下文、推理优化
长文本处理领军者，200K+ 上下文窗口

深度求索 - DeepSeek Blog

方向：代码生成、MoE架构
代码能力强劲，MoE 架构创新

零一万物 - Yi Blog

方向：Yi系列模型、长上下文
李开复创立，Yi 系列高性能模型

百川智能 - 官网

方向：开源基座模型、垂直领域应用
王小川创立，开源基座模型与行业应用

面壁智能 - ModelBest

方向：CPM系列、高效训练
清华系创业，CPM 系列模型与高效训练

阶跃星辰 - StepFun

方向：Step系列、数学推理
数学推理与科学计算能力突出

三、公司官方博客

国际公司

OpenAI - openai.com/blog

GPT系列一手资讯，获取最新模型发布和技术解读

Google DeepMind - deepmind.google/blog

AI先驱，基础研究突破，AlphaFold 等里程碑

Anthropic - anthropic.com/blog

AI对齐和安全，Constitutional AI、Claude 技术细节

Meta AI - ai.meta.com/blog

LLaMA系列，开源导向，视觉研究

Mistral AI - mistral.ai/news

高效模型，欧洲视角，小模型高性能

Hugging Face - huggingface.co/blog

开源社区中心，模型与数据集平台

中国公司

阿里云 - developer.aliyun.com/group/ai

通义系列，云端AI服务

腾讯AI Lab - ai.tencent.com

游戏AI与多模态研究，混元模型

百度AI - ai.baidu.com

文心大模型与产业AI应用

四、学术机构

UC Berkeley BAIR - bair.berkeley.edu/blog

机器人、RL、NLP 等多领域覆盖

Stanford HAI - hai.stanford.edu/news

以人为本的 AI 研究与政策

MIT CSAIL - csail.mit.edu/news

计算机科学与 AI 前沿

Mila (Montreal) - mila.quebec/en/blog

Bengio 领导，深度学习理论与因果推理

上海AI Lab - shlab.org.cn/news

书生多模态大模型与开源生态

清华AI研究院 - air.tsinghua.edu.cn

中国 AI 学术前沿，产学研结合

Distill - distill.pub

交互式论文，可视化解释复杂概念

五、学习路径推荐

🌱 初学者（0-6个月）

基础概念：Jay Alammar 图解系列 → Chris Olah 可视化教程
代码实践：Andrej Karpathy 教程 → Hugging Face 文档
系统学习：Lilian Weng 综述 → Sebastian Ruder NLP News
中文资源：通义千问博客 → 智谱AI技术文档

🌿 进阶研究者（6-18个月）

架构深入：Yi Tay 架构分析 → Jason Wei 涌现能力
安全对齐：Chris Olah 可解释性 → Neel Nanda 机制解释
工程优化：Tim Dettmers 量化 → Chip Huyen MLOps
中文前沿：Qwen 技术博客 → DeepSeek MoE 架构

🌳 专家级（18个月+）

理论前沿：Geoffrey Hinton、Yoshua Bengio、Yann LeCun 三巨头
AGI探索：Ilya Sutskever、Demis Hassabis、François Chollet
对齐研究：Jan Leike、Evan Hubinger、Alignment Forum
产业实践：各大公司官方博客 → 创业公司技术博客

六、按角色推荐

AI 应用工程师

必读：Lilian Weng（全局认知）
精读：Sophia Yang、Eugene Yan（RAG/Agent构建）
参考：Tim Dettmers（部署成本优化）

模型算法研究员

必读：Yi Tay、Jason Wei（架构与Prompt范式）
精读：Chris Olah、Neel Nanda（理论突破线索）
参考：Albert Q. Jiang（推理能力边界）

技术管理者（CTO/VP）

必读：Greg Brockman、Chip Huyen（团队与基础设施）
精读：Yann LeCun、François Chollet（保持清醒认知）
参考：Sebastian Ruder（行业趋势追踪）

AI 安全研究员

必读：Chris Olah、Neel Nanda（可解释性）
精读：Jan Leike、Evan Hubinger（对齐理论）
参考：Nelson Elhage（系统安全）

中文 NLP 研究者

必读：Qwen 团队（开源大模型）
精读：智谱AI、Kimi 团队（中文技术）
参考：字节 AI Lab（工业应用）

七、特殊主题资源

AI 安全与对齐

Alignment Forum - AI 对齐社区核心讨论平台
AI Safety Support - AI 安全职业与学习资源
80,000 Hours AI Safety - AI 安全职业指南

开源工具与平台

Hugging Face - 开源模型与数据集中心
Papers With Code - 论文代码实现索引

中文 AI 社区

机器之心 - 中文 AI 资讯与技术解读
PaperWeekly - 中文论文解读社区

视频教程

Andrej Karpathy YouTube - 深度学习教学视频
3Blue1Brown - 数学与神经网络可视化

持续学习建议

每周阅读：订阅 Sebastian Ruder 的 NLP News、Lilian Weng 的新文章
每月深入：精读 1-2 篇长文，做笔记和代码复现
每季度回顾：关注 OpenAI、DeepMind、Anthropic 的重大发布
关注中文生态：跟踪 Qwen、智谱、Kimi 等国内团队的技术进展
参与社区：Hugging Face、GitHub、Alignment Forum 等平台互动
批判性思考：阅读 Yann LeCun、François Chollet 等人的反思文章

最后更新：2025年12月4日

维护者：向阳乔木 | 🌐 www.qiaomu.ai | 🐦 @vista8

贡献：欢迎提交 PR 补充更多优质资源

posted @ 2026-01-11 15:06 Qtong 阅读(4) 评论(0) 收藏举报

刷新页面返回顶部

Qtong

AI博客精选 -- 参见 https://github.com/joeseesun/ai-blog-res/

AI 研究者博客资源大全

一、个人技术博客

🏆 百科全书派（综述、知识体系化）

🔬 机制解释派（黑盒逆向、电路分析）

🏗️ 架构扩展派（缩放定律、高效架构）

⚡ 高效工程派（量化、推理优化）

🚀 应用落地派（MLOps、RAG、系统设计）

🌐 开放科学派（开源、批判性思考）

二、中国 AI 研究者与团队

大厂团队

创业公司

三、公司官方博客

国际公司

中国公司

四、学术机构

五、学习路径推荐

🌱 初学者（0-6个月）

🌿 进阶研究者（6-18个月）

🌳 专家级（18个月+）

六、按角色推荐

AI 应用工程师

模型算法研究员

技术管理者（CTO/VP）

AI 安全研究员

创业公司技术负责人

学术界研究员

中文 NLP 研究者

企业 AI 开发者

七、派别分类速查

百科全书派

机制解释派

架构扩展派

高效工程派

开放科学派

应用落地派

八、内容风格分类

系统性综述

可视化教学

代码驱动

哲学思辨

实战教程

职业反思

硬核调试

艺术融合

学术严谨

九、更新频率参考

高频更新

中频更新

项目驱动

里程碑式

主页索引型

官方公告

十、地区分布

美国（硅谷）

美国（学术界）

欧洲

加拿大

英国

中国（大厂）

中国（创业）

中国（学术）

跨机构流动

十一、快速链接汇总

OpenAI系

Anthropic系

Google/DeepMind系

Meta/FAIR系

Mistral AI系

深度学习先驱

独立/跨机构

中国AI团队

国际公司官方博客

学术机构

十二、特殊主题资源

AI 安全与对齐

开源工具与平台

中文 AI 社区

视频教程