AI博客精选 -- 参见 https://github.com/joeseesun/ai-blog-res/

AI 研究者博客资源大全

精选全球顶级 AI 研究者博客与学习资源,助你快速掌握人工智能前沿动态。


一、个人技术博客

🏆 百科全书派(综述、知识体系化)

Lilian Weng - Lil'Log

  • 机构:OpenAI | 方向:安全系统、RLHF、Agent
  • 行业必读综述文献,体系化程度高,每篇相当于小综述
  • 适合:研究员、技术负责人、需快速掌握领域全貌者
  • 重点:AI代理架构、对抗攻击、幻觉问题、RLHF

Sebastian Ruder - ruder.io

  • 机构:Cohere(前DeepMind) | 方向:NLP、多语言模型、迁移学习
  • NLP News 简报是行业标准,理论深度高
  • 适合:NLP研究员、多语言模型开发者
  • 重点:多任务学习、迁移学习、NLP前沿

Jay Alammar - The Illustrated AI Blog

  • 机构:Cohere | 方向:可视化教学
  • 图解式教学,全球公认最佳入门资源
  • 适合:初学者、需要直观理解模型者
  • 重点:Transformer图解、GPT图解、BERT图解

🔬 机制解释派(黑盒逆向、电路分析)

Chris Olah - Colah's Blog

  • 机构:Anthropic | 方向:可解释性、神经网络可视化
  • 深度学习的显微镜,连接数学抽象与视觉直觉
  • 适合:AI安全研究员、理论物理背景学者
  • 重点:回路分析、流形结构、研究债务

Neel Nanda - neelnanda.io

  • 机构:DeepMind(前Anthropic) | 方向:机制可解释性、逆向工程
  • 可解释性研究实战手册,有大量代码和练习
  • 适合:AI安全研究员、深度学习原理探索者
  • 重点:Grokking现象、感应头、TransformerLens

Jan Leike - Musings on the Alignment Problem

  • 机构:独立(前OpenAI) | 方向:AI对齐、Superalignment
  • 系统讨论对齐问题,直接表达研究者观点
  • 适合:AI安全研究员、对齐研究者
  • 重点:对齐税、最小可行对齐方案

Evan Hubinger - Alignment Forum

  • 机构:Anthropic | 方向:内对齐、欺骗性对齐
  • 对齐社区长篇blog,理论深度高
  • 适合:AI安全研究员、对齐理论研究者
  • 重点:内对齐、欺骗性对齐

Matthias Gerstgrasser - Personal Site

  • 机构:OpenAI | 方向:多智能体学习、机制设计
  • 聚焦AI与人/AI共存问题
  • 适合:多智能体研究者、机制设计研究者
  • 重点:多智能体系统、激励设计

🏗️ 架构扩展派(缩放定律、高效架构)

Jason Wei - jasonwei.net

  • 机构:Meta(前OpenAI/Google Brain) | 方向:CoT、涌现能力、Scaling Laws
  • 思维链与涌现能力布道者,连接缩放定律与 Prompt 工程
  • 适合:模型算法研究员、Prompt工程师
  • 重点:涌现现象、思维链机制、指令微调

Yi Tay - yitay.net

  • 机构:DeepMind | 方向:高效Transformer、架构设计
  • 架构师必读圣经,深刻洞察模型架构历史
  • 适合:大模型架构师、基础设施工程师
  • 重点:T5 vs GPT、归纳偏置、Scaling

Guillaume Lample - GitHub

  • 机构:Mistral AI | 方向:高效模型、Chinchilla优化
  • 小模型大能力教科书,高效派巅峰
  • 适合:资源受限的研究者、创业公司
  • 重点:Llama训练、RAG、数据最优比

Albert Q. Jiang - albertqjiang.github.io

  • 机构:Mistral AI | 方向:数学推理、MoE模型
  • 推理与效率的未来方向
  • 适合:推理能力研究者、MoE开发者
  • 重点:数学超智能、Mixtral、稀疏激活

Hyung Won Chung - GitHub/YouTube

  • 机构:Meta(前OpenAI/Google) | 方向:指令微调、模型行为
  • 理解微调本质必读
  • 适合:模型训练工程师、微调研究者
  • 重点:指令微调规模化、激励vs教导

Ashwin Vaswani - Personal Site

  • 机构:DeepMind | 方向:多模态、医疗AI
  • Transformer发明者之一,追踪架构鼻祖足迹
  • 适合:架构研究者、多模态开发者
  • 重点:多模态融合、Speech2Face

Ilya Sutskever - cs.toronto.edu/~ilya

  • 机构:SSI(前OpenAI) | 方向:深度学习理论、AGI安全
  • 深度学习先驱,AlexNet共同作者,AGI路径探索者
  • 适合:深度学习研究员、AGI研究者
  • 重点:序列建模、无监督学习、AGI安全

Alex Krizhevsky - cs.toronto.edu/~kriz

  • 机构:独立(前Google) | 方向:卷积神经网络、ImageNet
  • AlexNet作者,开启深度学习革命
  • 适合:计算机视觉研究员、深度学习历史研究者
  • 重点:AlexNet、CIFAR数据集、卷积网络

Demis Hassabis - DeepMind

  • 机构:Google DeepMind | 方向:AGI、强化学习、神经科学
  • DeepMind创始人,AlphaGo之父,诺贝尔化学奖得主
  • 适合:AGI研究者、强化学习研究员、跨学科研究者
  • 重点:AlphaGo、AlphaFold、AGI路径

⚡ 高效工程派(量化、推理优化)

Tim Dettmers - timdettmers.com

  • 机构:CMU/Allen Institute | 方向:量化、消费级硬件
  • 贫穷研究者救星,消费级硬件运行大模型
  • 适合:创业公司CTO、个人开发者
  • 重点:QLoRA、GPU选购指南、模型压缩

Nelson Elhage - blog.nelhage.com

  • 机构:Anthropic | 方向:系统工程、性能优化
  • 系统工程师硬核指南,底层调试经验丰富
  • 适合:训练集群维护者、推理优化工程师
  • 重点:性能工程、GPU调试、大规模系统

Jeff Dean - research.google/people/jeff

  • 机构:Google | 方向:大规模系统、分布式训练
  • Google AI基础设施领军人物,系统架构大师
  • 适合:系统架构师、分布式训练工程师
  • 重点:TensorFlow、大规模ML系统、TPU

🚀 应用落地派(MLOps、RAG、系统设计)

Andrej Karpathy - karpathy.github.io

  • 机构:Eureka Labs(前OpenAI/Tesla) | 方向:深度学习教育、Software 2.0
  • 直觉构建大师,通过代码和类比解释复杂概念
  • 适合:工程师、深度学习入门者
  • 重点:Software 2.0、RNN、反向传播、LLM心理学

Greg Brockman - blog.gregbrockman.com

  • 机构:OpenAI | 方向:技术领导力、AI基础设施
  • 基础设施与工程文化蓝本,记录OpenAI成长历程
  • 适合:CTO、技术管理者、架构师
  • 重点:技术领导力、ML转型、分布式系统

Chip Huyen - huyenchip.com

  • 机构:Voltron Data | 方向:MLOps、实时ML
  • 生产环境 ML 系统设计专家
  • 适合:MLOps工程师、数据科学家
  • 重点:数据漂移、特征存储、实时推理

Eugene Yan - eugeneyan.com

  • 机构:Amazon | 方向:推荐系统、LLM应用
  • 推荐系统与 LLM 工程落地
  • 适合:推荐系统工程师、LLM应用开发者
  • 重点:LLM-as-Judge、RAG设计模式

Sophia Yang - Medium

  • 机构:Mistral AI | 方向:开发者关系、应用落地
  • 开发者落地手册,实战教程丰富
  • 适合:应用开发工程师、产品经理
  • 重点:Mistral实战、RAG构建、函数调用

Ravi Theja - The Maximalists

  • 机构:Mistral AI(顾问) | 方向:企业级RAG
  • 专注企业级LLM应用实践
  • 适合:企业AI工程师、RAG开发者
  • 重点:GraphRAG、CorrectiveRAG、MoA

Max Mynter - The Maximalists (Substack)

  • 机构:Mistral AI | 方向:职业发展、研究工程
  • 从候选人视角讲如何进入顶级LLM实验室
  • 适合:求职者、职业规划者
  • 重点:研究工程师路径、心态分享

Yennie Jun - Art Fish Intelligence

  • 机构:DeepMind | 方向:数据叙事、LLM行为
  • 半生活半技术,数据叙事参考
  • 适合:产品故事写作者、创意研究者
  • 重点:自我数据分析、LLM创造力评测

🌐 开放科学派(开源、批判性思考)

Yann LeCun - yann.lecun.com

  • 机构:Meta | 方向:世界模型、JEPA、开源哲学
  • 了解"非主流"AGI路径,对 Scaling Laws 保持警惕
  • 适合:学术研究员、开源社区成员
  • 重点:世界模型、非自回归、开源哲学

François Chollet - Substack

  • 机构:Google | 方向:深度学习局限、ARC挑战
  • 反炒作哲学思考,批判性视角
  • 适合:学术研究员、对主流路线持怀疑态度者
  • 重点:推理与抽象、ARC基准、神经符号AI

Ross Girshick - rossgirshick.info

  • 机构:Meta FAIR | 方向:计算机视觉、目标检测
  • 多模态视觉基础,定义现代计算机视觉
  • 适合:视觉研究员、多模态开发者
  • 重点:R-CNN系列、SAM、视觉Transformer

Smitha Milli - smithamilli.com

  • 机构:Meta FAIR | 方向:AI对齐、博弈论
  • 社会技术视角补充,数学社会学视角
  • 适合:AI伦理研究者、政策制定者
  • 重点:对齐博弈、推荐系统社会动力学

David Ha - ōtoro

  • 机构:Sakana AI(前Google Brain) | 方向:神经网络与艺术融合
  • 实验型博客,代码+可视化+思想组合
  • 适合:创意AI研究者、艺术与技术交叉者
  • 重点:进化算法、神经网络艺术

Geoffrey Hinton - cs.toronto.edu/~hinton

  • 机构:独立(前Google) | 方向:深度学习基础、反向传播、胶囊网络
  • 深度学习教父,图灵奖得主,神经网络复兴推动者
  • 适合:所有AI研究者、深度学习理论研究者
  • 重点:反向传播、Dropout、胶囊网络、AI风险

Yoshua Bengio - yoshuabengio.org

  • 机构:Mila/Montreal | 方向:深度学习理论、因果推理、AI安全
  • 深度学习三巨头之一,图灵奖得主,因果AI倡导者
  • 适合:深度学习研究员、因果推理研究者
  • 重点:注意力机制、生成模型、因果AI、AI伦理

Fei-Fei Li - Stanford Profile

  • 机构:Stanford/Google Cloud | 方向:计算机视觉、ImageNet、AI伦理
  • 计算机视觉奠基人,ImageNet创建者,人本AI倡导者
  • 适合:视觉研究员、AI伦理研究者、教育工作者
  • 重点:ImageNet、视觉识别、AI人文关怀

二、中国 AI 研究者与团队

大厂团队

通义千问 - Qwen Blog

  • 机构:阿里云 | 方向:开源大模型、多模态、长文本
  • 国内顶级开源大模型,技术博客详尽
  • 适合:中文NLP研究者、开源模型开发者
  • 重点:Qwen系列、长文本处理、多模态融合

智谱AI - 技术博客

  • 方向:GLM系列、CodeGeeX、CogView
  • ChatGLM 系列开源模型,代码生成与视觉生成
  • 适合:中文大模型开发者、代码生成研究者
  • 重点:GLM架构、代码生成、文生图

字节跳动AI Lab - Publications

  • 方向:多模态、推荐系统、NLP
  • 工业级AI应用,推荐系统与多模态前沿
  • 适合:推荐系统工程师、多模态研究者
  • 重点:推荐算法、视频理解、内容生成

MiniMax - MiniMax Blog

  • 方向:语音生成、多模态交互
  • 语音大模型与多模态交互创新
  • 适合:语音AI研究者、多模态交互开发者
  • 重点:语音合成、多模态对话、情感计算

创业公司

Kimi / 月之暗面 - Moonshot Blog

  • 方向:超长上下文、推理优化
  • 长文本处理领军者,200K+ 上下文窗口
  • 适合:长文本应用开发者、对话系统研究者
  • 重点:长上下文技术、推理优化、对话系统

深度求索 - DeepSeek Blog

  • 方向:代码生成、MoE架构
  • 代码能力强劲,MoE 架构创新
  • 适合:代码生成研究者、MoE架构开发者
  • 重点:DeepSeek Coder、MoE架构、推理优化

零一万物 - Yi Blog

  • 方向:Yi系列模型、长上下文
  • 李开复创立,Yi 系列高性能模型
  • 适合:中英双语模型研究者、长文本开发者
  • 重点:Yi模型架构、双语能力、长上下文

百川智能 - 官网

  • 方向:开源基座模型、垂直领域应用
  • 王小川创立,开源基座模型与行业应用
  • 适合:垂直领域AI开发者、开源模型研究者
  • 重点:Baichuan模型、领域适配、模型压缩

面壁智能 - ModelBest

  • 方向:CPM系列、高效训练
  • 清华系创业,CPM 系列模型与高效训练
  • 适合:学术界转工业界研究者、高效训练研究者
  • 重点:CPM模型、参数高效微调、知识蒸馏

阶跃星辰 - StepFun

  • 方向:Step系列、数学推理
  • 数学推理与科学计算能力突出
  • 适合:数学推理研究者、科学计算开发者
  • 重点:数学推理、科学问答、逻辑推理

海螺AI - MiniMax Hailuo

  • 方向:视频生成、多模态内容
  • 视频生成领域创新者
  • 适合:视频生成研究者、内容创作者
  • 重点:文生视频、视频理解、创意生成

暗礁AI - Dark Rocks AI

  • 方向:Agent、工作流自动化
  • 企业级AI Agent与自动化
  • 适合:Agent开发者、企业AI应用工程师
  • 重点:AI Agent、工作流、企业应用

循环智能 - Recurrent AI

  • 方向:对话智能、销售AI
  • 对话智能与销售场景AI应用
  • 适合:对话系统开发者、销售AI研究者
  • 重点:对话分析、销售智能、情感识别

衔远科技 - Xverse AI

  • 方向:金融大模型、垂直领域
  • 金融等垂直领域大模型专家
  • 适合:金融AI开发者、垂直领域研究者
  • 重点:金融NLP、风险控制、领域知识

澜舟科技 - Langboat

  • 方向:企业级NLP、知识图谱
  • 周明创立,企业级NLP解决方案
  • 适合:企业NLP工程师、知识图谱开发者
  • 重点:企业NLP、知识抽取、文本挖掘

三、公司官方博客

国际公司

OpenAI - openai.com/blog

  • 特色:GPT系列、一手资讯
  • 获取最新模型发布和技术解读
  • 适合:所有AI从业者
  • 重点:GPT技术解读、API更新、安全研究

Google DeepMind - deepmind.google/blog

  • 特色:AI先驱、跨学科研究
  • 基础研究突破,AlphaFold 等里程碑
  • 适合:研究员、跨学科研究者
  • 重点:强化学习、蛋白质预测、游戏AI

Anthropic - anthropic.com/blog

  • 特色:AI对齐和安全
  • Constitutional AI、Claude 技术细节
  • 适合:AI安全研究员、对齐研究者
  • 重点:对齐技术、安全评估、可解释性

Meta AI - ai.meta.com/blog

  • 特色:LLaMA系列、开源导向
  • 开源模型发布、视觉研究
  • 适合:开源社区、视觉研究者
  • 重点:LLaMA、SAM、开源生态

Mistral AI - mistral.ai/news

  • 特色:高效模型、欧洲视角
  • 小模型高性能,MoE架构
  • 适合:资源受限开发者、欧洲AI关注者
  • 重点:Mistral模型、Mixtral、效率优化

Cohere - cohere.com/blog

  • 特色:企业级NLP、RAG
  • 企业级应用、RAG最佳实践
  • 适合:企业AI开发者、RAG研究者
  • 重点:企业NLP、RAG、语义搜索

Hugging Face - huggingface.co/blog

  • 特色:开源社区、模型分享
  • 开源生态中心,模型与数据集平台
  • 适合:开源开发者、模型研究者
  • 重点:Transformers库、模型部署、社区实践

Stability AI - stability.ai/blog

  • 特色:开源生成模型、Stable Diffusion
  • 图像生成领军者,开源生成模型
  • 适合:图像生成研究者、创意AI开发者
  • 重点:Stable Diffusion、图像生成、开源生成

Scale AI - scale.com/blog

  • 特色:数据标注、RLHF
  • 数据工程与RLHF实践
  • 适合:数据工程师、RLHF研究者
  • 重点:数据质量、RLHF、人类反馈

Together AI - together.ai/blog

  • 特色:去中心化训练、开源模型
  • 分布式训练与开源模型托管
  • 适合:分布式训练研究者、开源开发者
  • 重点:分布式训练、模型托管、开源协作

中国公司

阿里云 - developer.aliyun.com/group/ai

  • 特色:通义系列、云原生AI
  • 云端AI服务与通义系列模型
  • 适合:云端AI开发者、企业AI应用者
  • 重点:通义千问、PAI平台、云原生AI

腾讯AI Lab - ai.tencent.com

  • 特色:游戏AI、多模态、NLP
  • 游戏AI与多模态研究
  • 适合:游戏AI研究者、多模态开发者
  • 重点:游戏AI、混元模型、多模态

百度AI - ai.baidu.com

  • 特色:文心系列、产业应用
  • 文心大模型与产业AI应用
  • 适合:产业AI开发者、中文NLP研究者
  • 重点:文心一言、飞桨框架、产业AI

商汤科技 - sensetime.com

  • 特色:计算机视觉、具身智能
  • 视觉AI与具身智能领军者
  • 适合:视觉AI研究者、机器人开发者
  • 重点:计算机视觉、具身智能、自动驾驶

旷视科技 - research.megvii.com

  • 特色:计算机视觉、检测识别
  • 视觉检测与识别技术
  • 适合:视觉算法工程师、检测识别研究者
  • 重点:目标检测、人脸识别、视觉算法

四、学术机构

UC Berkeley BAIR - bair.berkeley.edu/blog

  • 特色:学术前沿、跨领域研究
  • 机器人、RL、NLP 等多领域覆盖
  • 适合:学术研究者、博士生
  • 重点:强化学习、机器人、多模态

Stanford HAI - hai.stanford.edu/news

  • 特色:人本AI、AI伦理
  • 以人为本的 AI 研究与政策
  • 适合:AI伦理研究者、政策制定者
  • 重点:AI伦理、人本AI、政策研究

MIT CSAIL - csail.mit.edu/news

  • 特色:计算机科学前沿
  • MIT 计算机科学与 AI 实验室
  • 适合:学术研究者、技术前沿探索者
  • 重点:机器学习、机器人、系统

CMU AI Blog - blog.ml.cmu.edu

  • 特色:机器学习理论与应用
  • CMU机器学习系博客
  • 适合:机器学习研究者、理论研究者
  • 重点:学习理论、优化、深度学习

Mila (Montreal) - mila.quebec/en/blog

  • 特色:深度学习理论、因果推理
  • Bengio 领导的蒙特利尔AI研究所
  • 适合:深度学习理论研究者、因果推理研究者
  • 重点:深度学习理论、因果AI、生成模型

上海AI Lab - shlab.org.cn/news

  • 特色:开源开放、书生系列
  • 书生多模态大模型与开源生态
  • 适合:开源研究者、多模态开发者
  • 重点:书生模型、多模态、开源生态

清华AI研究院 - air.tsinghua.edu.cn

  • 特色:中国AI学术前沿
  • 清华AI研究与产业结合
  • 适合:中国学术界、产学研结合者
  • 重点:基础研究、产业应用、人才培养

北京大学AI研究院 - ai.pku.edu.cn

  • 特色:跨学科AI研究
  • 北大跨学科AI研究
  • 适合:跨学科研究者、理论研究者
  • 重点:AI理论、跨学科应用

Distill - distill.pub

  • 特色:可视化学术、交互体验
  • 交互式论文,可视化解释复杂概念
  • 适合:视觉学习者、教育者
  • 重点:可视化ML、交互式解释

Alignment Forum - alignmentforum.org

  • 特色:AI对齐社区
  • 对齐研究的核心讨论平台
  • 适合:AI安全研究员
  • 重点:对齐理论、安全研究

五、学习路径推荐

🌱 初学者(0-6个月)

  1. 基础概念:Jay Alammar 图解系列 → Chris Olah 可视化教程
  2. 代码实践:Andrej Karpathy 教程 → Hugging Face 文档
  3. 系统学习:Lilian Weng 综述 → Sebastian Ruder NLP News
  4. 中文资源:通义千问博客 → 智谱AI技术文档

🌿 进阶研究者(6-18个月)

  1. 架构深入:Yi Tay 架构分析 → Jason Wei 涌现能力
  2. 安全对齐:Chris Olah 可解释性 → Neel Nanda 机制解释
  3. 工程优化:Tim Dettmers 量化 → Chip Huyen MLOps
  4. 中文前沿:Qwen 技术博客 → DeepSeek MoE 架构

🌳 专家级(18个月+)

  1. 理论前沿:Geoffrey Hinton、Yoshua Bengio、Yann LeCun 三巨头
  2. AGI探索:Ilya Sutskever、Demis Hassabis、François Chollet
  3. 对齐研究:Jan Leike、Evan Hubinger、Alignment Forum
  4. 产业实践:各大公司官方博客 → 创业公司技术博客

六、按角色推荐

AI 应用工程师

  • 必读:Lilian Weng(全局认知)
  • 精读:Sophia Yang、Eugene Yan(RAG/Agent构建)
  • 参考:Tim Dettmers(部署成本优化)

模型算法研究员

  • 必读:Yi Tay、Jason Wei(架构与Prompt范式)
  • 精读:Chris Olah、Neel Nanda(理论突破线索)
  • 参考:Albert Q. Jiang(推理能力边界)

技术管理者(CTO/VP)

  • 必读:Greg Brockman、Chip Huyen(团队与基础设施)
  • 精读:Yann LeCun、François Chollet(保持清醒认知)
  • 参考:Sebastian Ruder(行业趋势追踪)

AI 安全研究员

  • 必读:Chris Olah、Neel Nanda(可解释性)
  • 精读:Jan Leike、Evan Hubinger(对齐理论)
  • 参考:Nelson Elhage(系统安全)

创业公司技术负责人

  • 必读:Tim Dettmers(资源优化)
  • 精读:Guillaume Lample(高效模型)
  • 参考:Yi Tay(算力战略)

学术界研究员

  • 必读:Yann LeCun(非主流路径)
  • 精读:François Chollet(批判性思考)
  • 参考:Ross Girshick(视觉基础)

中文 NLP 研究者

  • 必读:Qwen 团队(开源大模型)
  • 精读:智谱AI、Kimi 团队(中文技术)
  • 参考:字节 AI Lab(工业应用)

企业 AI 开发者

  • 必读:Chip Huyen、Eugene Yan(MLOps)
  • 精读:澜舟科技、循环智能(企业场景)
  • 参考:衔远科技(垂直领域)

七、派别分类速查

百科全书派

  • 核心关注:综述、知识体系化、前沿追踪
  • 代表人物:Lilian Weng、Sebastian Ruder、Jay Alammar
  • 适合读者:需要快速掌握领域全貌的研究员、技术负责人

机制解释派

  • 核心关注:黑盒逆向、电路分析、顿悟现象
  • 代表人物:Chris Olah、Neel Nanda、Jan Leike、Evan Hubinger
  • 适合读者:AI安全研究员、理论物理背景学者、深度学习原理探索者

架构扩展派

  • 核心关注:缩放定律、高效架构、算力优化
  • 代表人物:Yi Tay、Jason Wei、Guillaume Lample、Ilya Sutskever、Demis Hassabis、Qwen团队
  • 适合读者:大模型架构师、基础设施工程师、CTO

高效工程派

  • 核心关注:量化、消费级硬件、推理优化
  • 代表人物:Tim Dettmers、Nelson Elhage、Jeff Dean、面壁智能
  • 适合读者:创业公司CTO、个人开发者、边缘计算工程师

开放科学派

  • 核心关注:非自回归、视觉基础、开源哲学
  • 代表人物:Yann LeCun、Ross Girshick、François Chollet、Geoffrey Hinton、Yoshua Bengio、Fei-Fei Li
  • 适合读者:学术界研究员、对主流Transformer路线持怀疑态度的创新者

应用落地派

  • 核心关注:MLOps、RAG、系统设计
  • 代表人物:Chip Huyen、Eugene Yan、Sophia Yang、Andrej Karpathy、字节AI Lab
  • 适合读者:应用开发工程师、产品经理、数据科学家

八、内容风格分类

系统性综述

  • 代表:Lilian Weng、Sebastian Ruder
  • 特点:阅读数十篇论文后整理成逻辑严密的长文,统一符号体系

可视化教学

  • 代表:Chris Olah、Jay Alammar
  • 特点:大量图解、交互式内容,直观解释复杂概念

代码驱动

  • 代表:Andrej Karpathy、Neel Nanda
  • 特点:通过代码片段和实现细节构建直觉

哲学思辨

  • 代表:Yann LeCun、François Chollet、Geoffrey Hinton、Yoshua Bengio
  • 特点:宏观视角、批判性思考、长期路线探讨

实战教程

  • 代表:Sophia Yang、Eugene Yan、Chip Huyen、Qwen团队
  • 特点:How-to文档、生产环境经验、工程最佳实践

职业反思

  • 代表:Jason Wei、Max Mynter、Greg Brockman
  • 特点:职业路径、人生选择、团队建设经验

硬核调试

  • 代表:Nelson Elhage、Tim Dettmers、Jeff Dean
  • 特点:底层系统问题、性能优化、硬件选型

艺术融合

  • 代表:David Ha、Yennie Jun
  • 特点:创意实验、数据叙事、跨界探索

学术严谨

  • 代表:Fei-Fei Li、Ilya Sutskever、Geoffrey Hinton、Yoshua Bengio
  • 特点:学术论文风格、理论深度、数学严谨

九、更新频率参考

高频更新

Lilian Weng、Sebastian Ruder、Eugene Yan、Qwen团队、智谱AI

  • 定期发布高质量长文或简报

中频更新

Jason Wei、Yi Tay、Chip Huyen、字节AI Lab、Kimi团队

  • 有重要研究或思考时更新

项目驱动

Chris Olah、Neel Nanda、深度求索、海螺AI

  • 随研究项目发布深度文章

里程碑式

Andrej Karpathy、Yann LeCun、Geoffrey Hinton、Ilya Sutskever

  • 重大观点或教程时更新

主页索引型

Guillaume Lample、Albert Q. Jiang、Ross Girshick、Alex Krizhevsky、Fei-Fei Li

  • 主要作为论文和项目索引

官方公告

OpenAI、DeepMind、Anthropic、Meta AI、阿里云、腾讯AI Lab

  • 产品发布、研究成果公告

十、地区分布

美国(硅谷)

OpenAI系、Anthropic系、Meta系、Stanford HAI

  • 主流技术路线、规模化思维

美国(学术界)

UC Berkeley、MIT、CMU、Fei-Fei Li、Geoffrey Hinton

  • 基础研究、理论创新

欧洲

Mistral AI团队(Guillaume Lample、Albert Q. Jiang)

  • 高效务实、资源约束下创新

加拿大

Yoshua Bengio、Geoffrey Hinton、Ilya Sutskever、Mila

  • 深度学习发源地、理论深度

英国

DeepMind、Demis Hassabis

  • AGI探索、跨学科研究

中国(大厂)

阿里云Qwen、腾讯AI Lab、百度AI、字节跳动

  • 工业级应用、大规模部署

中国(创业)

智谱AI、月之暗面、百川智能、零一万物、面壁智能、阶跃星辰、深度求索

  • 技术创新、垂直场景、开源生态

中国(学术)

清华AI研究院、北大AI研究院、上海AI Lab

  • 学术前沿、产学研结合

跨机构流动

Jason Wei、Yi Tay、Neel Nanda、Ilya Sutskever

  • 多元视角、跨公司经验对比

十一、快速链接汇总

OpenAI系

Anthropic系

Google/DeepMind系

Meta/FAIR系

Mistral AI系

深度学习先驱

独立/跨机构

中国AI团队

国际公司官方博客

学术机构


十二、特殊主题资源

AI 安全与对齐

开源工具与平台

中文 AI 社区

视频教程


持续学习建议

  • 每周阅读:订阅 Sebastian Ruder 的 NLP News、Lilian Weng 的新文章
  • 每月深入:精读 1-2 篇长文,做笔记和代码复现
  • 每季度回顾:关注 OpenAI、DeepMind、Anthropic 的重大发布
  • 关注中文生态:跟踪 Qwen、智谱、Kimi 等国内团队的技术进展
  • 参与社区:Hugging Face、GitHub、Alignment Forum 等平台互动
  • 批判性思考:阅读 Yann LeCun、François Chollet 等人的反思文章

最后更新:2025年12月4日

维护者:向阳乔木 | 🌐 www.qiaomu.ai | 🐦 @vista8

贡献:欢迎提交 PR 补充更多优质资源

精选全球顶级 AI 研究者博客与学习资源,助你快速掌握人工智能前沿动态。


一、个人技术博客

🏆 百科全书派(综述、知识体系化)

Lilian Weng - Lil'Log

  • 机构:OpenAI | 方向:安全系统、RLHF、Agent
  • 行业必读综述文献,体系化程度高,每篇相当于小综述
  • 适合:研究员、技术负责人、需快速掌握领域全貌者

Sebastian Ruder - ruder.io

  • 机构:Cohere(前DeepMind) | 方向:NLP、多语言模型、迁移学习
  • NLP News 简报是行业标准,理论深度高
  • 适合:NLP研究员、多语言模型开发者

Jay Alammar - The Illustrated AI Blog

  • 机构:Cohere | 方向:可视化教学
  • 图解式教学,全球公认最佳入门资源
  • 适合:初学者、需要直观理解模型者

🔬 机制解释派(黑盒逆向、电路分析)

Chris Olah - Colah's Blog

  • 机构:Anthropic | 方向:可解释性、神经网络可视化
  • 深度学习的显微镜,连接数学抽象与视觉直觉
  • 适合:AI安全研究员、理论物理背景学者

Neel Nanda - neelnanda.io

  • 机构:DeepMind(前Anthropic) | 方向:机制可解释性、逆向工程
  • 可解释性研究实战手册,有大量代码和练习
  • 适合:AI安全研究员、深度学习原理探索者

Jan Leike - Musings on the Alignment Problem

  • 机构:独立(前OpenAI) | 方向:AI对齐、Superalignment
  • 系统讨论对齐问题,直接表达研究者观点
  • 适合:AI安全研究员、对齐研究者

🏗️ 架构扩展派(缩放定律、高效架构)

Jason Wei - jasonwei.net

  • 机构:Meta(前OpenAI/Google Brain) | 方向:CoT、涌现能力、Scaling Laws
  • 思维链与涌现能力布道者,连接缩放定律与 Prompt 工程
  • 适合:模型算法研究员、Prompt工程师

Yi Tay - yitay.net

  • 机构:DeepMind | 方向:高效Transformer、架构设计
  • 架构师必读圣经,深刻洞察模型架构历史
  • 适合:大模型架构师、基础设施工程师

Guillaume Lample - GitHub

  • 机构:Mistral AI | 方向:高效模型、Chinchilla优化
  • 小模型大能力教科书,高效派巅峰
  • 适合:资源受限的研究者、创业公司

⚡ 高效工程派(量化、推理优化)

Tim Dettmers - timdettmers.com

  • 机构:CMU/Allen Institute | 方向:量化、消费级硬件
  • 贫穷研究者救星,消费级硬件运行大模型
  • 适合:创业公司CTO、个人开发者

Nelson Elhage - blog.nelhage.com

  • 机构:Anthropic | 方向:系统工程、性能优化
  • 系统工程师硬核指南,底层调试经验丰富
  • 适合:训练集群维护者、推理优化工程师

🚀 应用落地派(MLOps、RAG、系统设计)

Andrej Karpathy - karpathy.github.io

  • 机构:Eureka Labs(前OpenAI/Tesla) | 方向:深度学习教育、Software 2.0
  • 直觉构建大师,通过代码和类比解释复杂概念
  • 适合:工程师、深度学习入门者

Chip Huyen - huyenchip.com

  • 机构:Voltron Data | 方向:MLOps、实时ML
  • 生产环境 ML 系统设计专家
  • 适合:MLOps工程师、数据科学家

Eugene Yan - eugeneyan.com

  • 机构:Amazon | 方向:推荐系统、LLM应用
  • 推荐系统与 LLM 工程落地
  • 适合:推荐系统工程师、LLM应用开发者

Sophia Yang - Medium

  • 机构:Mistral AI | 方向:开发者关系、应用落地
  • 开发者落地手册,实战教程丰富
  • 适合:应用开发工程师、产品经理

🌐 开放科学派(开源、批判性思考)

Yann LeCun - yann.lecun.com

  • 机构:Meta | 方向:世界模型、JEPA、开源哲学
  • 了解"非主流"AGI路径,对 Scaling Laws 保持警惕
  • 适合:学术研究员、开源社区成员

François Chollet - Substack

  • 机构:Google | 方向:深度学习局限、ARC挑战
  • 反炒作哲学思考,批判性视角
  • 适合:学术研究员、对主流路线持怀疑态度者

David Ha - ōtoro

  • 机构:Sakana AI(前Google Brain) | 方向:神经网络与艺术融合
  • 实验型博客,代码+可视化+思想组合
  • 适合:创意AI研究者、艺术与技术交叉者

👑 深度学习先驱

Geoffrey Hinton - cs.toronto.edu/~hinton

  • 深度学习教父,图灵奖得主,神经网络复兴推动者
  • 重点:反向传播、Dropout、胶囊网络、AI风险

Yoshua Bengio - yoshuabengio.org

  • 深度学习三巨头之一,图灵奖得主,因果AI倡导者
  • 重点:注意力机制、生成模型、因果AI、AI伦理

Ilya Sutskever - cs.toronto.edu/~ilya

  • 深度学习先驱,AlexNet共同作者,AGI路径探索者
  • 重点:序列建模、无监督学习、AGI安全

Fei-Fei Li - Stanford Profile

  • ImageNet创建者,人本AI倡导者
  • 重点:ImageNet、视觉识别、AI人文关怀

Demis Hassabis - DeepMind

  • DeepMind创始人,AlphaGo之父,诺贝尔化学奖得主

二、中国 AI 研究者与团队

大厂团队

通义千问 - Qwen Blog

  • 机构:阿里云 | 方向:开源大模型、多模态、长文本
  • 国内顶级开源大模型,技术博客详尽

智谱AI - 技术博客

  • 方向:GLM系列、CodeGeeX、CogView
  • ChatGLM 系列开源模型,代码生成与视觉生成

字节跳动AI Lab - Publications

  • 方向:多模态、推荐系统、NLP
  • 工业级AI应用,推荐系统与多模态前沿

创业公司

Kimi / 月之暗面 - Moonshot Blog

  • 方向:超长上下文、推理优化
  • 长文本处理领军者,200K+ 上下文窗口

深度求索 - DeepSeek Blog

  • 方向:代码生成、MoE架构
  • 代码能力强劲,MoE 架构创新

零一万物 - Yi Blog

  • 方向:Yi系列模型、长上下文
  • 李开复创立,Yi 系列高性能模型

百川智能 - 官网

  • 方向:开源基座模型、垂直领域应用
  • 王小川创立,开源基座模型与行业应用

面壁智能 - ModelBest

  • 方向:CPM系列、高效训练
  • 清华系创业,CPM 系列模型与高效训练

阶跃星辰 - StepFun

  • 方向:Step系列、数学推理
  • 数学推理与科学计算能力突出

三、公司官方博客

国际公司

OpenAI - openai.com/blog

  • GPT系列一手资讯,获取最新模型发布和技术解读

Google DeepMind - deepmind.google/blog

  • AI先驱,基础研究突破,AlphaFold 等里程碑

Anthropic - anthropic.com/blog

  • AI对齐和安全,Constitutional AI、Claude 技术细节

Meta AI - ai.meta.com/blog

  • LLaMA系列,开源导向,视觉研究

Mistral AI - mistral.ai/news

  • 高效模型,欧洲视角,小模型高性能

Hugging Face - huggingface.co/blog

  • 开源社区中心,模型与数据集平台

中国公司

阿里云 - developer.aliyun.com/group/ai

  • 通义系列,云端AI服务

腾讯AI Lab - ai.tencent.com

  • 游戏AI与多模态研究,混元模型

百度AI - ai.baidu.com

  • 文心大模型与产业AI应用

四、学术机构

UC Berkeley BAIR - bair.berkeley.edu/blog

  • 机器人、RL、NLP 等多领域覆盖

Stanford HAI - hai.stanford.edu/news

  • 以人为本的 AI 研究与政策

MIT CSAIL - csail.mit.edu/news

  • 计算机科学与 AI 前沿

Mila (Montreal) - mila.quebec/en/blog

  • Bengio 领导,深度学习理论与因果推理

上海AI Lab - shlab.org.cn/news

  • 书生多模态大模型与开源生态

清华AI研究院 - air.tsinghua.edu.cn

  • 中国 AI 学术前沿,产学研结合

Distill - distill.pub

  • 交互式论文,可视化解释复杂概念

五、学习路径推荐

🌱 初学者(0-6个月)

  1. 基础概念:Jay Alammar 图解系列 → Chris Olah 可视化教程
  2. 代码实践:Andrej Karpathy 教程 → Hugging Face 文档
  3. 系统学习:Lilian Weng 综述 → Sebastian Ruder NLP News
  4. 中文资源:通义千问博客 → 智谱AI技术文档

🌿 进阶研究者(6-18个月)

  1. 架构深入:Yi Tay 架构分析 → Jason Wei 涌现能力
  2. 安全对齐:Chris Olah 可解释性 → Neel Nanda 机制解释
  3. 工程优化:Tim Dettmers 量化 → Chip Huyen MLOps
  4. 中文前沿:Qwen 技术博客 → DeepSeek MoE 架构

🌳 专家级(18个月+)

  1. 理论前沿:Geoffrey Hinton、Yoshua Bengio、Yann LeCun 三巨头
  2. AGI探索:Ilya Sutskever、Demis Hassabis、François Chollet
  3. 对齐研究:Jan Leike、Evan Hubinger、Alignment Forum
  4. 产业实践:各大公司官方博客 → 创业公司技术博客

六、按角色推荐

AI 应用工程师

  • 必读:Lilian Weng(全局认知)
  • 精读:Sophia Yang、Eugene Yan(RAG/Agent构建)
  • 参考:Tim Dettmers(部署成本优化)

模型算法研究员

  • 必读:Yi Tay、Jason Wei(架构与Prompt范式)
  • 精读:Chris Olah、Neel Nanda(理论突破线索)
  • 参考:Albert Q. Jiang(推理能力边界)

技术管理者(CTO/VP)

  • 必读:Greg Brockman、Chip Huyen(团队与基础设施)
  • 精读:Yann LeCun、François Chollet(保持清醒认知)
  • 参考:Sebastian Ruder(行业趋势追踪)

AI 安全研究员

  • 必读:Chris Olah、Neel Nanda(可解释性)
  • 精读:Jan Leike、Evan Hubinger(对齐理论)
  • 参考:Nelson Elhage(系统安全)

中文 NLP 研究者

  • 必读:Qwen 团队(开源大模型)
  • 精读:智谱AI、Kimi 团队(中文技术)
  • 参考:字节 AI Lab(工业应用)

七、特殊主题资源

AI 安全与对齐

开源工具与平台

中文 AI 社区

视频教程


持续学习建议

  • 每周阅读:订阅 Sebastian Ruder 的 NLP News、Lilian Weng 的新文章
  • 每月深入:精读 1-2 篇长文,做笔记和代码复现
  • 每季度回顾:关注 OpenAI、DeepMind、Anthropic 的重大发布
  • 关注中文生态:跟踪 Qwen、智谱、Kimi 等国内团队的技术进展
  • 参与社区:Hugging Face、GitHub、Alignment Forum 等平台互动
  • 批判性思考:阅读 Yann LeCun、François Chollet 等人的反思文章

最后更新:2025年12月4日

维护者:向阳乔木 | 🌐 www.qiaomu.ai | 🐦 @vista8

贡献:欢迎提交 PR 补充更多优质资源

posted @ 2026-01-11 15:06  Qtong  阅读(4)  评论(0)    收藏  举报