AI博客精选 -- 参见 https://github.com/joeseesun/ai-blog-res/
AI 研究者博客资源大全
精选全球顶级 AI 研究者博客与学习资源,助你快速掌握人工智能前沿动态。
一、个人技术博客
🏆 百科全书派(综述、知识体系化)
Lilian Weng - Lil'Log
- 机构:OpenAI | 方向:安全系统、RLHF、Agent
- 行业必读综述文献,体系化程度高,每篇相当于小综述
- 适合:研究员、技术负责人、需快速掌握领域全貌者
- 重点:AI代理架构、对抗攻击、幻觉问题、RLHF
Sebastian Ruder - ruder.io
- 机构:Cohere(前DeepMind) | 方向:NLP、多语言模型、迁移学习
- NLP News 简报是行业标准,理论深度高
- 适合:NLP研究员、多语言模型开发者
- 重点:多任务学习、迁移学习、NLP前沿
Jay Alammar - The Illustrated AI Blog
- 机构:Cohere | 方向:可视化教学
- 图解式教学,全球公认最佳入门资源
- 适合:初学者、需要直观理解模型者
- 重点:Transformer图解、GPT图解、BERT图解
🔬 机制解释派(黑盒逆向、电路分析)
Chris Olah - Colah's Blog
- 机构:Anthropic | 方向:可解释性、神经网络可视化
- 深度学习的显微镜,连接数学抽象与视觉直觉
- 适合:AI安全研究员、理论物理背景学者
- 重点:回路分析、流形结构、研究债务
Neel Nanda - neelnanda.io
- 机构:DeepMind(前Anthropic) | 方向:机制可解释性、逆向工程
- 可解释性研究实战手册,有大量代码和练习
- 适合:AI安全研究员、深度学习原理探索者
- 重点:Grokking现象、感应头、TransformerLens
Jan Leike - Musings on the Alignment Problem
- 机构:独立(前OpenAI) | 方向:AI对齐、Superalignment
- 系统讨论对齐问题,直接表达研究者观点
- 适合:AI安全研究员、对齐研究者
- 重点:对齐税、最小可行对齐方案
Evan Hubinger - Alignment Forum
- 机构:Anthropic | 方向:内对齐、欺骗性对齐
- 对齐社区长篇blog,理论深度高
- 适合:AI安全研究员、对齐理论研究者
- 重点:内对齐、欺骗性对齐
Matthias Gerstgrasser - Personal Site
- 机构:OpenAI | 方向:多智能体学习、机制设计
- 聚焦AI与人/AI共存问题
- 适合:多智能体研究者、机制设计研究者
- 重点:多智能体系统、激励设计
🏗️ 架构扩展派(缩放定律、高效架构)
Jason Wei - jasonwei.net
- 机构:Meta(前OpenAI/Google Brain) | 方向:CoT、涌现能力、Scaling Laws
- 思维链与涌现能力布道者,连接缩放定律与 Prompt 工程
- 适合:模型算法研究员、Prompt工程师
- 重点:涌现现象、思维链机制、指令微调
Yi Tay - yitay.net
- 机构:DeepMind | 方向:高效Transformer、架构设计
- 架构师必读圣经,深刻洞察模型架构历史
- 适合:大模型架构师、基础设施工程师
- 重点:T5 vs GPT、归纳偏置、Scaling
Guillaume Lample - GitHub
- 机构:Mistral AI | 方向:高效模型、Chinchilla优化
- 小模型大能力教科书,高效派巅峰
- 适合:资源受限的研究者、创业公司
- 重点:Llama训练、RAG、数据最优比
Albert Q. Jiang - albertqjiang.github.io
- 机构:Mistral AI | 方向:数学推理、MoE模型
- 推理与效率的未来方向
- 适合:推理能力研究者、MoE开发者
- 重点:数学超智能、Mixtral、稀疏激活
Hyung Won Chung - GitHub/YouTube
- 机构:Meta(前OpenAI/Google) | 方向:指令微调、模型行为
- 理解微调本质必读
- 适合:模型训练工程师、微调研究者
- 重点:指令微调规模化、激励vs教导
Ashwin Vaswani - Personal Site
- 机构:DeepMind | 方向:多模态、医疗AI
- Transformer发明者之一,追踪架构鼻祖足迹
- 适合:架构研究者、多模态开发者
- 重点:多模态融合、Speech2Face
Ilya Sutskever - cs.toronto.edu/~ilya
- 机构:SSI(前OpenAI) | 方向:深度学习理论、AGI安全
- 深度学习先驱,AlexNet共同作者,AGI路径探索者
- 适合:深度学习研究员、AGI研究者
- 重点:序列建模、无监督学习、AGI安全
Alex Krizhevsky - cs.toronto.edu/~kriz
- 机构:独立(前Google) | 方向:卷积神经网络、ImageNet
- AlexNet作者,开启深度学习革命
- 适合:计算机视觉研究员、深度学习历史研究者
- 重点:AlexNet、CIFAR数据集、卷积网络
Demis Hassabis - DeepMind
- 机构:Google DeepMind | 方向:AGI、强化学习、神经科学
- DeepMind创始人,AlphaGo之父,诺贝尔化学奖得主
- 适合:AGI研究者、强化学习研究员、跨学科研究者
- 重点:AlphaGo、AlphaFold、AGI路径
⚡ 高效工程派(量化、推理优化)
Tim Dettmers - timdettmers.com
- 机构:CMU/Allen Institute | 方向:量化、消费级硬件
- 贫穷研究者救星,消费级硬件运行大模型
- 适合:创业公司CTO、个人开发者
- 重点:QLoRA、GPU选购指南、模型压缩
Nelson Elhage - blog.nelhage.com
- 机构:Anthropic | 方向:系统工程、性能优化
- 系统工程师硬核指南,底层调试经验丰富
- 适合:训练集群维护者、推理优化工程师
- 重点:性能工程、GPU调试、大规模系统
Jeff Dean - research.google/people/jeff
- 机构:Google | 方向:大规模系统、分布式训练
- Google AI基础设施领军人物,系统架构大师
- 适合:系统架构师、分布式训练工程师
- 重点:TensorFlow、大规模ML系统、TPU
🚀 应用落地派(MLOps、RAG、系统设计)
Andrej Karpathy - karpathy.github.io
- 机构:Eureka Labs(前OpenAI/Tesla) | 方向:深度学习教育、Software 2.0
- 直觉构建大师,通过代码和类比解释复杂概念
- 适合:工程师、深度学习入门者
- 重点:Software 2.0、RNN、反向传播、LLM心理学
Greg Brockman - blog.gregbrockman.com
- 机构:OpenAI | 方向:技术领导力、AI基础设施
- 基础设施与工程文化蓝本,记录OpenAI成长历程
- 适合:CTO、技术管理者、架构师
- 重点:技术领导力、ML转型、分布式系统
Chip Huyen - huyenchip.com
- 机构:Voltron Data | 方向:MLOps、实时ML
- 生产环境 ML 系统设计专家
- 适合:MLOps工程师、数据科学家
- 重点:数据漂移、特征存储、实时推理
Eugene Yan - eugeneyan.com
- 机构:Amazon | 方向:推荐系统、LLM应用
- 推荐系统与 LLM 工程落地
- 适合:推荐系统工程师、LLM应用开发者
- 重点:LLM-as-Judge、RAG设计模式
Sophia Yang - Medium
- 机构:Mistral AI | 方向:开发者关系、应用落地
- 开发者落地手册,实战教程丰富
- 适合:应用开发工程师、产品经理
- 重点:Mistral实战、RAG构建、函数调用
Ravi Theja - The Maximalists
- 机构:Mistral AI(顾问) | 方向:企业级RAG
- 专注企业级LLM应用实践
- 适合:企业AI工程师、RAG开发者
- 重点:GraphRAG、CorrectiveRAG、MoA
Max Mynter - The Maximalists (Substack)
- 机构:Mistral AI | 方向:职业发展、研究工程
- 从候选人视角讲如何进入顶级LLM实验室
- 适合:求职者、职业规划者
- 重点:研究工程师路径、心态分享
Yennie Jun - Art Fish Intelligence
- 机构:DeepMind | 方向:数据叙事、LLM行为
- 半生活半技术,数据叙事参考
- 适合:产品故事写作者、创意研究者
- 重点:自我数据分析、LLM创造力评测
🌐 开放科学派(开源、批判性思考)
Yann LeCun - yann.lecun.com
- 机构:Meta | 方向:世界模型、JEPA、开源哲学
- 了解"非主流"AGI路径,对 Scaling Laws 保持警惕
- 适合:学术研究员、开源社区成员
- 重点:世界模型、非自回归、开源哲学
François Chollet - Substack
- 机构:Google | 方向:深度学习局限、ARC挑战
- 反炒作哲学思考,批判性视角
- 适合:学术研究员、对主流路线持怀疑态度者
- 重点:推理与抽象、ARC基准、神经符号AI
Ross Girshick - rossgirshick.info
- 机构:Meta FAIR | 方向:计算机视觉、目标检测
- 多模态视觉基础,定义现代计算机视觉
- 适合:视觉研究员、多模态开发者
- 重点:R-CNN系列、SAM、视觉Transformer
Smitha Milli - smithamilli.com
- 机构:Meta FAIR | 方向:AI对齐、博弈论
- 社会技术视角补充,数学社会学视角
- 适合:AI伦理研究者、政策制定者
- 重点:对齐博弈、推荐系统社会动力学
David Ha - ōtoro
- 机构:Sakana AI(前Google Brain) | 方向:神经网络与艺术融合
- 实验型博客,代码+可视化+思想组合
- 适合:创意AI研究者、艺术与技术交叉者
- 重点:进化算法、神经网络艺术
Geoffrey Hinton - cs.toronto.edu/~hinton
- 机构:独立(前Google) | 方向:深度学习基础、反向传播、胶囊网络
- 深度学习教父,图灵奖得主,神经网络复兴推动者
- 适合:所有AI研究者、深度学习理论研究者
- 重点:反向传播、Dropout、胶囊网络、AI风险
Yoshua Bengio - yoshuabengio.org
- 机构:Mila/Montreal | 方向:深度学习理论、因果推理、AI安全
- 深度学习三巨头之一,图灵奖得主,因果AI倡导者
- 适合:深度学习研究员、因果推理研究者
- 重点:注意力机制、生成模型、因果AI、AI伦理
Fei-Fei Li - Stanford Profile
- 机构:Stanford/Google Cloud | 方向:计算机视觉、ImageNet、AI伦理
- 计算机视觉奠基人,ImageNet创建者,人本AI倡导者
- 适合:视觉研究员、AI伦理研究者、教育工作者
- 重点:ImageNet、视觉识别、AI人文关怀
二、中国 AI 研究者与团队
大厂团队
通义千问 - Qwen Blog
- 机构:阿里云 | 方向:开源大模型、多模态、长文本
- 国内顶级开源大模型,技术博客详尽
- 适合:中文NLP研究者、开源模型开发者
- 重点:Qwen系列、长文本处理、多模态融合
智谱AI - 技术博客
- 方向:GLM系列、CodeGeeX、CogView
- ChatGLM 系列开源模型,代码生成与视觉生成
- 适合:中文大模型开发者、代码生成研究者
- 重点:GLM架构、代码生成、文生图
字节跳动AI Lab - Publications
- 方向:多模态、推荐系统、NLP
- 工业级AI应用,推荐系统与多模态前沿
- 适合:推荐系统工程师、多模态研究者
- 重点:推荐算法、视频理解、内容生成
MiniMax - MiniMax Blog
- 方向:语音生成、多模态交互
- 语音大模型与多模态交互创新
- 适合:语音AI研究者、多模态交互开发者
- 重点:语音合成、多模态对话、情感计算
创业公司
Kimi / 月之暗面 - Moonshot Blog
- 方向:超长上下文、推理优化
- 长文本处理领军者,200K+ 上下文窗口
- 适合:长文本应用开发者、对话系统研究者
- 重点:长上下文技术、推理优化、对话系统
深度求索 - DeepSeek Blog
- 方向:代码生成、MoE架构
- 代码能力强劲,MoE 架构创新
- 适合:代码生成研究者、MoE架构开发者
- 重点:DeepSeek Coder、MoE架构、推理优化
零一万物 - Yi Blog
- 方向:Yi系列模型、长上下文
- 李开复创立,Yi 系列高性能模型
- 适合:中英双语模型研究者、长文本开发者
- 重点:Yi模型架构、双语能力、长上下文
百川智能 - 官网
- 方向:开源基座模型、垂直领域应用
- 王小川创立,开源基座模型与行业应用
- 适合:垂直领域AI开发者、开源模型研究者
- 重点:Baichuan模型、领域适配、模型压缩
面壁智能 - ModelBest
- 方向:CPM系列、高效训练
- 清华系创业,CPM 系列模型与高效训练
- 适合:学术界转工业界研究者、高效训练研究者
- 重点:CPM模型、参数高效微调、知识蒸馏
阶跃星辰 - StepFun
- 方向:Step系列、数学推理
- 数学推理与科学计算能力突出
- 适合:数学推理研究者、科学计算开发者
- 重点:数学推理、科学问答、逻辑推理
海螺AI - MiniMax Hailuo
- 方向:视频生成、多模态内容
- 视频生成领域创新者
- 适合:视频生成研究者、内容创作者
- 重点:文生视频、视频理解、创意生成
暗礁AI - Dark Rocks AI
- 方向:Agent、工作流自动化
- 企业级AI Agent与自动化
- 适合:Agent开发者、企业AI应用工程师
- 重点:AI Agent、工作流、企业应用
循环智能 - Recurrent AI
- 方向:对话智能、销售AI
- 对话智能与销售场景AI应用
- 适合:对话系统开发者、销售AI研究者
- 重点:对话分析、销售智能、情感识别
衔远科技 - Xverse AI
- 方向:金融大模型、垂直领域
- 金融等垂直领域大模型专家
- 适合:金融AI开发者、垂直领域研究者
- 重点:金融NLP、风险控制、领域知识
澜舟科技 - Langboat
- 方向:企业级NLP、知识图谱
- 周明创立,企业级NLP解决方案
- 适合:企业NLP工程师、知识图谱开发者
- 重点:企业NLP、知识抽取、文本挖掘
三、公司官方博客
国际公司
OpenAI - openai.com/blog
- 特色:GPT系列、一手资讯
- 获取最新模型发布和技术解读
- 适合:所有AI从业者
- 重点:GPT技术解读、API更新、安全研究
Google DeepMind - deepmind.google/blog
- 特色:AI先驱、跨学科研究
- 基础研究突破,AlphaFold 等里程碑
- 适合:研究员、跨学科研究者
- 重点:强化学习、蛋白质预测、游戏AI
Anthropic - anthropic.com/blog
- 特色:AI对齐和安全
- Constitutional AI、Claude 技术细节
- 适合:AI安全研究员、对齐研究者
- 重点:对齐技术、安全评估、可解释性
Meta AI - ai.meta.com/blog
- 特色:LLaMA系列、开源导向
- 开源模型发布、视觉研究
- 适合:开源社区、视觉研究者
- 重点:LLaMA、SAM、开源生态
Mistral AI - mistral.ai/news
- 特色:高效模型、欧洲视角
- 小模型高性能,MoE架构
- 适合:资源受限开发者、欧洲AI关注者
- 重点:Mistral模型、Mixtral、效率优化
Cohere - cohere.com/blog
- 特色:企业级NLP、RAG
- 企业级应用、RAG最佳实践
- 适合:企业AI开发者、RAG研究者
- 重点:企业NLP、RAG、语义搜索
Hugging Face - huggingface.co/blog
- 特色:开源社区、模型分享
- 开源生态中心,模型与数据集平台
- 适合:开源开发者、模型研究者
- 重点:Transformers库、模型部署、社区实践
Stability AI - stability.ai/blog
- 特色:开源生成模型、Stable Diffusion
- 图像生成领军者,开源生成模型
- 适合:图像生成研究者、创意AI开发者
- 重点:Stable Diffusion、图像生成、开源生成
Scale AI - scale.com/blog
- 特色:数据标注、RLHF
- 数据工程与RLHF实践
- 适合:数据工程师、RLHF研究者
- 重点:数据质量、RLHF、人类反馈
Together AI - together.ai/blog
- 特色:去中心化训练、开源模型
- 分布式训练与开源模型托管
- 适合:分布式训练研究者、开源开发者
- 重点:分布式训练、模型托管、开源协作
中国公司
阿里云 - developer.aliyun.com/group/ai
- 特色:通义系列、云原生AI
- 云端AI服务与通义系列模型
- 适合:云端AI开发者、企业AI应用者
- 重点:通义千问、PAI平台、云原生AI
腾讯AI Lab - ai.tencent.com
- 特色:游戏AI、多模态、NLP
- 游戏AI与多模态研究
- 适合:游戏AI研究者、多模态开发者
- 重点:游戏AI、混元模型、多模态
百度AI - ai.baidu.com
- 特色:文心系列、产业应用
- 文心大模型与产业AI应用
- 适合:产业AI开发者、中文NLP研究者
- 重点:文心一言、飞桨框架、产业AI
商汤科技 - sensetime.com
- 特色:计算机视觉、具身智能
- 视觉AI与具身智能领军者
- 适合:视觉AI研究者、机器人开发者
- 重点:计算机视觉、具身智能、自动驾驶
旷视科技 - research.megvii.com
- 特色:计算机视觉、检测识别
- 视觉检测与识别技术
- 适合:视觉算法工程师、检测识别研究者
- 重点:目标检测、人脸识别、视觉算法
四、学术机构
UC Berkeley BAIR - bair.berkeley.edu/blog
- 特色:学术前沿、跨领域研究
- 机器人、RL、NLP 等多领域覆盖
- 适合:学术研究者、博士生
- 重点:强化学习、机器人、多模态
Stanford HAI - hai.stanford.edu/news
- 特色:人本AI、AI伦理
- 以人为本的 AI 研究与政策
- 适合:AI伦理研究者、政策制定者
- 重点:AI伦理、人本AI、政策研究
MIT CSAIL - csail.mit.edu/news
- 特色:计算机科学前沿
- MIT 计算机科学与 AI 实验室
- 适合:学术研究者、技术前沿探索者
- 重点:机器学习、机器人、系统
CMU AI Blog - blog.ml.cmu.edu
- 特色:机器学习理论与应用
- CMU机器学习系博客
- 适合:机器学习研究者、理论研究者
- 重点:学习理论、优化、深度学习
Mila (Montreal) - mila.quebec/en/blog
- 特色:深度学习理论、因果推理
- Bengio 领导的蒙特利尔AI研究所
- 适合:深度学习理论研究者、因果推理研究者
- 重点:深度学习理论、因果AI、生成模型
上海AI Lab - shlab.org.cn/news
- 特色:开源开放、书生系列
- 书生多模态大模型与开源生态
- 适合:开源研究者、多模态开发者
- 重点:书生模型、多模态、开源生态
清华AI研究院 - air.tsinghua.edu.cn
- 特色:中国AI学术前沿
- 清华AI研究与产业结合
- 适合:中国学术界、产学研结合者
- 重点:基础研究、产业应用、人才培养
北京大学AI研究院 - ai.pku.edu.cn
- 特色:跨学科AI研究
- 北大跨学科AI研究
- 适合:跨学科研究者、理论研究者
- 重点:AI理论、跨学科应用
Distill - distill.pub
- 特色:可视化学术、交互体验
- 交互式论文,可视化解释复杂概念
- 适合:视觉学习者、教育者
- 重点:可视化ML、交互式解释
Alignment Forum - alignmentforum.org
- 特色:AI对齐社区
- 对齐研究的核心讨论平台
- 适合:AI安全研究员
- 重点:对齐理论、安全研究
五、学习路径推荐
🌱 初学者(0-6个月)
- 基础概念:Jay Alammar 图解系列 → Chris Olah 可视化教程
- 代码实践:Andrej Karpathy 教程 → Hugging Face 文档
- 系统学习:Lilian Weng 综述 → Sebastian Ruder NLP News
- 中文资源:通义千问博客 → 智谱AI技术文档
🌿 进阶研究者(6-18个月)
- 架构深入:Yi Tay 架构分析 → Jason Wei 涌现能力
- 安全对齐:Chris Olah 可解释性 → Neel Nanda 机制解释
- 工程优化:Tim Dettmers 量化 → Chip Huyen MLOps
- 中文前沿:Qwen 技术博客 → DeepSeek MoE 架构
🌳 专家级(18个月+)
- 理论前沿:Geoffrey Hinton、Yoshua Bengio、Yann LeCun 三巨头
- AGI探索:Ilya Sutskever、Demis Hassabis、François Chollet
- 对齐研究:Jan Leike、Evan Hubinger、Alignment Forum
- 产业实践:各大公司官方博客 → 创业公司技术博客
六、按角色推荐
AI 应用工程师
- 必读:Lilian Weng(全局认知)
- 精读:Sophia Yang、Eugene Yan(RAG/Agent构建)
- 参考:Tim Dettmers(部署成本优化)
模型算法研究员
- 必读:Yi Tay、Jason Wei(架构与Prompt范式)
- 精读:Chris Olah、Neel Nanda(理论突破线索)
- 参考:Albert Q. Jiang(推理能力边界)
技术管理者(CTO/VP)
- 必读:Greg Brockman、Chip Huyen(团队与基础设施)
- 精读:Yann LeCun、François Chollet(保持清醒认知)
- 参考:Sebastian Ruder(行业趋势追踪)
AI 安全研究员
- 必读:Chris Olah、Neel Nanda(可解释性)
- 精读:Jan Leike、Evan Hubinger(对齐理论)
- 参考:Nelson Elhage(系统安全)
创业公司技术负责人
- 必读:Tim Dettmers(资源优化)
- 精读:Guillaume Lample(高效模型)
- 参考:Yi Tay(算力战略)
学术界研究员
- 必读:Yann LeCun(非主流路径)
- 精读:François Chollet(批判性思考)
- 参考:Ross Girshick(视觉基础)
中文 NLP 研究者
- 必读:Qwen 团队(开源大模型)
- 精读:智谱AI、Kimi 团队(中文技术)
- 参考:字节 AI Lab(工业应用)
企业 AI 开发者
- 必读:Chip Huyen、Eugene Yan(MLOps)
- 精读:澜舟科技、循环智能(企业场景)
- 参考:衔远科技(垂直领域)
七、派别分类速查
百科全书派
- 核心关注:综述、知识体系化、前沿追踪
- 代表人物:Lilian Weng、Sebastian Ruder、Jay Alammar
- 适合读者:需要快速掌握领域全貌的研究员、技术负责人
机制解释派
- 核心关注:黑盒逆向、电路分析、顿悟现象
- 代表人物:Chris Olah、Neel Nanda、Jan Leike、Evan Hubinger
- 适合读者:AI安全研究员、理论物理背景学者、深度学习原理探索者
架构扩展派
- 核心关注:缩放定律、高效架构、算力优化
- 代表人物:Yi Tay、Jason Wei、Guillaume Lample、Ilya Sutskever、Demis Hassabis、Qwen团队
- 适合读者:大模型架构师、基础设施工程师、CTO
高效工程派
- 核心关注:量化、消费级硬件、推理优化
- 代表人物:Tim Dettmers、Nelson Elhage、Jeff Dean、面壁智能
- 适合读者:创业公司CTO、个人开发者、边缘计算工程师
开放科学派
- 核心关注:非自回归、视觉基础、开源哲学
- 代表人物:Yann LeCun、Ross Girshick、François Chollet、Geoffrey Hinton、Yoshua Bengio、Fei-Fei Li
- 适合读者:学术界研究员、对主流Transformer路线持怀疑态度的创新者
应用落地派
- 核心关注:MLOps、RAG、系统设计
- 代表人物:Chip Huyen、Eugene Yan、Sophia Yang、Andrej Karpathy、字节AI Lab
- 适合读者:应用开发工程师、产品经理、数据科学家
八、内容风格分类
系统性综述
- 代表:Lilian Weng、Sebastian Ruder
- 特点:阅读数十篇论文后整理成逻辑严密的长文,统一符号体系
可视化教学
- 代表:Chris Olah、Jay Alammar
- 特点:大量图解、交互式内容,直观解释复杂概念
代码驱动
- 代表:Andrej Karpathy、Neel Nanda
- 特点:通过代码片段和实现细节构建直觉
哲学思辨
- 代表:Yann LeCun、François Chollet、Geoffrey Hinton、Yoshua Bengio
- 特点:宏观视角、批判性思考、长期路线探讨
实战教程
- 代表:Sophia Yang、Eugene Yan、Chip Huyen、Qwen团队
- 特点:How-to文档、生产环境经验、工程最佳实践
职业反思
- 代表:Jason Wei、Max Mynter、Greg Brockman
- 特点:职业路径、人生选择、团队建设经验
硬核调试
- 代表:Nelson Elhage、Tim Dettmers、Jeff Dean
- 特点:底层系统问题、性能优化、硬件选型
艺术融合
- 代表:David Ha、Yennie Jun
- 特点:创意实验、数据叙事、跨界探索
学术严谨
- 代表:Fei-Fei Li、Ilya Sutskever、Geoffrey Hinton、Yoshua Bengio
- 特点:学术论文风格、理论深度、数学严谨
九、更新频率参考
高频更新
Lilian Weng、Sebastian Ruder、Eugene Yan、Qwen团队、智谱AI
- 定期发布高质量长文或简报
中频更新
Jason Wei、Yi Tay、Chip Huyen、字节AI Lab、Kimi团队
- 有重要研究或思考时更新
项目驱动
Chris Olah、Neel Nanda、深度求索、海螺AI
- 随研究项目发布深度文章
里程碑式
Andrej Karpathy、Yann LeCun、Geoffrey Hinton、Ilya Sutskever
- 重大观点或教程时更新
主页索引型
Guillaume Lample、Albert Q. Jiang、Ross Girshick、Alex Krizhevsky、Fei-Fei Li
- 主要作为论文和项目索引
官方公告
OpenAI、DeepMind、Anthropic、Meta AI、阿里云、腾讯AI Lab
- 产品发布、研究成果公告
十、地区分布
美国(硅谷)
OpenAI系、Anthropic系、Meta系、Stanford HAI
- 主流技术路线、规模化思维
美国(学术界)
UC Berkeley、MIT、CMU、Fei-Fei Li、Geoffrey Hinton
- 基础研究、理论创新
欧洲
Mistral AI团队(Guillaume Lample、Albert Q. Jiang)
- 高效务实、资源约束下创新
加拿大
Yoshua Bengio、Geoffrey Hinton、Ilya Sutskever、Mila
- 深度学习发源地、理论深度
英国
DeepMind、Demis Hassabis
- AGI探索、跨学科研究
中国(大厂)
阿里云Qwen、腾讯AI Lab、百度AI、字节跳动
- 工业级应用、大规模部署
中国(创业)
智谱AI、月之暗面、百川智能、零一万物、面壁智能、阶跃星辰、深度求索
- 技术创新、垂直场景、开源生态
中国(学术)
清华AI研究院、北大AI研究院、上海AI Lab
- 学术前沿、产学研结合
跨机构流动
Jason Wei、Yi Tay、Neel Nanda、Ilya Sutskever
- 多元视角、跨公司经验对比
十一、快速链接汇总
OpenAI系
- Lilian Weng: https://lilianweng.github.io
- Andrej Karpathy: https://karpathy.github.io
- Greg Brockman: https://blog.gregbrockman.com
- Matthias Gerstgrasser: https://matthias.gerstgrasser.net
- Jan Leike: https://aligned.substack.com
- Ilya Sutskever: https://www.cs.toronto.edu/~ilya
Anthropic系
- Chris Olah: https://colah.github.io
- Evan Hubinger: https://www.alignmentforum.org/users/evhub
- Nelson Elhage: https://blog.nelhage.com
Google/DeepMind系
- Yi Tay: https://yitay.net
- François Chollet: https://fchollet.substack.com
- Tim Dettmers: https://timdettmers.com
- Neel Nanda: https://neelnanda.io
- David Ha: https://blog.otoro.net
- Yennie Jun: https://www.artfish.ai
- Ashwin Vaswani: https://sites.google.com/view/ashwinvaswani
- Demis Hassabis: https://www.deepmind.com/about/demis-hassabis
- Jeff Dean: https://research.google/people/jeff
Meta/FAIR系
- Yann LeCun: https://yann.lecun.com
- Jason Wei: https://www.jasonwei.net
- Ross Girshick: https://rossgirshick.info
- Smitha Milli: https://smithamilli.com
Mistral AI系
- Guillaume Lample: https://github.com/glample
- Albert Q. Jiang: https://albertqjiang.github.io
- Sophia Yang: https://sophiamyang.medium.com
- Ravi Theja: https://sites.google.com/view/ravi-theja
深度学习先驱
- Geoffrey Hinton: https://www.cs.toronto.edu/~hinton
- Yoshua Bengio: https://yoshuabengio.org
- Fei-Fei Li: https://profiles.stanford.edu/fei-fei-li
- Alex Krizhevsky: https://www.cs.toronto.edu/~kriz
独立/跨机构
- Jay Alammar: https://jalammar.github.io
- Chip Huyen: https://huyenchip.com
- Eugene Yan: https://eugeneyan.com
- Sebastian Ruder: https://ruder.io
中国AI团队
- 通义千问: https://qwenlm.github.io/blog
- 智谱AI: https://zhipu-ai.feishu.cn/wiki/space/7309936523038679044
- Kimi/月之暗面: https://www.moonshot.cn/blog
- 字节跳动AI Lab: https://ailab.bytedance.com/publications
- 零一万物: https://www.01.ai/blog
- 百川智能: https://www.baichuan-ai.com/home
- 面壁智能: https://modelbest.cn/blog
- 阶跃星辰: https://www.stepfun.com/blog
- 深度求索: https://www.deepseek.com/blog
- 海螺AI: https://hailuoai.com/blog
- 阿里云: https://developer.aliyun.com/group/ai
- 腾讯AI Lab: https://ai.tencent.com/ailab/zh/index
- 百度AI: https://ai.baidu.com/forum/topic/list/168
- 上海AI Lab: https://www.shlab.org.cn/news
- 清华AI研究院: https://air.tsinghua.edu.cn/info/1007/1055.htm
- 北大AI研究院: https://www.ai.pku.edu.cn/info/1015/1033.htm
国际公司官方博客
- OpenAI: https://openai.com/blog
- DeepMind: https://deepmind.google/blog
- Anthropic: https://www.anthropic.com/blog
- Meta AI: https://ai.meta.com/blog
- Mistral AI: https://mistral.ai/news
- Cohere: https://cohere.com/blog
- Hugging Face: https://huggingface.co/blog
- Stability AI: https://stability.ai/blog
- Scale AI: https://scale.com/blog
- Together AI: https://www.together.ai/blog
学术机构
- BAIR (UC Berkeley): https://bair.berkeley.edu/blog
- Stanford HAI: https://hai.stanford.edu/news
- MIT CSAIL: https://www.csail.mit.edu/news
- CMU AI Blog: https://blog.ml.cmu.edu
- Mila: https://mila.quebec/en/blog
- Distill: https://distill.pub
- Alignment Forum: https://www.alignmentforum.org
十二、特殊主题资源
AI 安全与对齐
- Alignment Forum - AI 对齐社区核心讨论平台
- AI Safety Support - AI 安全职业与学习资源
- 80,000 Hours AI Safety - AI 安全职业指南
开源工具与平台
- Hugging Face - 开源模型与数据集中心
- Papers With Code - 论文代码实现索引
- GitHub Trending AI - AI项目趋势
中文 AI 社区
- 机器之心 - 中文 AI 资讯与技术解读
- AI科技评论 - 中文AI深度报道
- PaperWeekly - 中文论文解读社区
视频教程
- Andrej Karpathy YouTube - 深度学习教学视频
- 3Blue1Brown - 数学与神经网络可视化
- Two Minute Papers - AI论文快速解读
持续学习建议
- 每周阅读:订阅 Sebastian Ruder 的 NLP News、Lilian Weng 的新文章
- 每月深入:精读 1-2 篇长文,做笔记和代码复现
- 每季度回顾:关注 OpenAI、DeepMind、Anthropic 的重大发布
- 关注中文生态:跟踪 Qwen、智谱、Kimi 等国内团队的技术进展
- 参与社区:Hugging Face、GitHub、Alignment Forum 等平台互动
- 批判性思考:阅读 Yann LeCun、François Chollet 等人的反思文章
最后更新:2025年12月4日
维护者:向阳乔木 | 🌐 www.qiaomu.ai | 🐦 @vista8
贡献:欢迎提交 PR 补充更多优质资源
精选全球顶级 AI 研究者博客与学习资源,助你快速掌握人工智能前沿动态。
一、个人技术博客
🏆 百科全书派(综述、知识体系化)
Lilian Weng - Lil'Log
- 机构:OpenAI | 方向:安全系统、RLHF、Agent
- 行业必读综述文献,体系化程度高,每篇相当于小综述
- 适合:研究员、技术负责人、需快速掌握领域全貌者
Sebastian Ruder - ruder.io
- 机构:Cohere(前DeepMind) | 方向:NLP、多语言模型、迁移学习
- NLP News 简报是行业标准,理论深度高
- 适合:NLP研究员、多语言模型开发者
Jay Alammar - The Illustrated AI Blog
- 机构:Cohere | 方向:可视化教学
- 图解式教学,全球公认最佳入门资源
- 适合:初学者、需要直观理解模型者
🔬 机制解释派(黑盒逆向、电路分析)
Chris Olah - Colah's Blog
- 机构:Anthropic | 方向:可解释性、神经网络可视化
- 深度学习的显微镜,连接数学抽象与视觉直觉
- 适合:AI安全研究员、理论物理背景学者
Neel Nanda - neelnanda.io
- 机构:DeepMind(前Anthropic) | 方向:机制可解释性、逆向工程
- 可解释性研究实战手册,有大量代码和练习
- 适合:AI安全研究员、深度学习原理探索者
Jan Leike - Musings on the Alignment Problem
- 机构:独立(前OpenAI) | 方向:AI对齐、Superalignment
- 系统讨论对齐问题,直接表达研究者观点
- 适合:AI安全研究员、对齐研究者
🏗️ 架构扩展派(缩放定律、高效架构)
Jason Wei - jasonwei.net
- 机构:Meta(前OpenAI/Google Brain) | 方向:CoT、涌现能力、Scaling Laws
- 思维链与涌现能力布道者,连接缩放定律与 Prompt 工程
- 适合:模型算法研究员、Prompt工程师
Yi Tay - yitay.net
- 机构:DeepMind | 方向:高效Transformer、架构设计
- 架构师必读圣经,深刻洞察模型架构历史
- 适合:大模型架构师、基础设施工程师
Guillaume Lample - GitHub
- 机构:Mistral AI | 方向:高效模型、Chinchilla优化
- 小模型大能力教科书,高效派巅峰
- 适合:资源受限的研究者、创业公司
⚡ 高效工程派(量化、推理优化)
Tim Dettmers - timdettmers.com
- 机构:CMU/Allen Institute | 方向:量化、消费级硬件
- 贫穷研究者救星,消费级硬件运行大模型
- 适合:创业公司CTO、个人开发者
Nelson Elhage - blog.nelhage.com
- 机构:Anthropic | 方向:系统工程、性能优化
- 系统工程师硬核指南,底层调试经验丰富
- 适合:训练集群维护者、推理优化工程师
🚀 应用落地派(MLOps、RAG、系统设计)
Andrej Karpathy - karpathy.github.io
- 机构:Eureka Labs(前OpenAI/Tesla) | 方向:深度学习教育、Software 2.0
- 直觉构建大师,通过代码和类比解释复杂概念
- 适合:工程师、深度学习入门者
Chip Huyen - huyenchip.com
- 机构:Voltron Data | 方向:MLOps、实时ML
- 生产环境 ML 系统设计专家
- 适合:MLOps工程师、数据科学家
Eugene Yan - eugeneyan.com
- 机构:Amazon | 方向:推荐系统、LLM应用
- 推荐系统与 LLM 工程落地
- 适合:推荐系统工程师、LLM应用开发者
Sophia Yang - Medium
- 机构:Mistral AI | 方向:开发者关系、应用落地
- 开发者落地手册,实战教程丰富
- 适合:应用开发工程师、产品经理
🌐 开放科学派(开源、批判性思考)
Yann LeCun - yann.lecun.com
- 机构:Meta | 方向:世界模型、JEPA、开源哲学
- 了解"非主流"AGI路径,对 Scaling Laws 保持警惕
- 适合:学术研究员、开源社区成员
François Chollet - Substack
- 机构:Google | 方向:深度学习局限、ARC挑战
- 反炒作哲学思考,批判性视角
- 适合:学术研究员、对主流路线持怀疑态度者
David Ha - ōtoro
- 机构:Sakana AI(前Google Brain) | 方向:神经网络与艺术融合
- 实验型博客,代码+可视化+思想组合
- 适合:创意AI研究者、艺术与技术交叉者
👑 深度学习先驱
Geoffrey Hinton - cs.toronto.edu/~hinton
- 深度学习教父,图灵奖得主,神经网络复兴推动者
- 重点:反向传播、Dropout、胶囊网络、AI风险
Yoshua Bengio - yoshuabengio.org
- 深度学习三巨头之一,图灵奖得主,因果AI倡导者
- 重点:注意力机制、生成模型、因果AI、AI伦理
Ilya Sutskever - cs.toronto.edu/~ilya
- 深度学习先驱,AlexNet共同作者,AGI路径探索者
- 重点:序列建模、无监督学习、AGI安全
Fei-Fei Li - Stanford Profile
- ImageNet创建者,人本AI倡导者
- 重点:ImageNet、视觉识别、AI人文关怀
Demis Hassabis - DeepMind
- DeepMind创始人,AlphaGo之父,诺贝尔化学奖得主
二、中国 AI 研究者与团队
大厂团队
通义千问 - Qwen Blog
- 机构:阿里云 | 方向:开源大模型、多模态、长文本
- 国内顶级开源大模型,技术博客详尽
智谱AI - 技术博客
- 方向:GLM系列、CodeGeeX、CogView
- ChatGLM 系列开源模型,代码生成与视觉生成
字节跳动AI Lab - Publications
- 方向:多模态、推荐系统、NLP
- 工业级AI应用,推荐系统与多模态前沿
创业公司
Kimi / 月之暗面 - Moonshot Blog
- 方向:超长上下文、推理优化
- 长文本处理领军者,200K+ 上下文窗口
深度求索 - DeepSeek Blog
- 方向:代码生成、MoE架构
- 代码能力强劲,MoE 架构创新
零一万物 - Yi Blog
- 方向:Yi系列模型、长上下文
- 李开复创立,Yi 系列高性能模型
百川智能 - 官网
- 方向:开源基座模型、垂直领域应用
- 王小川创立,开源基座模型与行业应用
面壁智能 - ModelBest
- 方向:CPM系列、高效训练
- 清华系创业,CPM 系列模型与高效训练
阶跃星辰 - StepFun
- 方向:Step系列、数学推理
- 数学推理与科学计算能力突出
三、公司官方博客
国际公司
OpenAI - openai.com/blog
- GPT系列一手资讯,获取最新模型发布和技术解读
Google DeepMind - deepmind.google/blog
- AI先驱,基础研究突破,AlphaFold 等里程碑
Anthropic - anthropic.com/blog
- AI对齐和安全,Constitutional AI、Claude 技术细节
Meta AI - ai.meta.com/blog
- LLaMA系列,开源导向,视觉研究
Mistral AI - mistral.ai/news
- 高效模型,欧洲视角,小模型高性能
Hugging Face - huggingface.co/blog
- 开源社区中心,模型与数据集平台
中国公司
阿里云 - developer.aliyun.com/group/ai
- 通义系列,云端AI服务
腾讯AI Lab - ai.tencent.com
- 游戏AI与多模态研究,混元模型
百度AI - ai.baidu.com
- 文心大模型与产业AI应用
四、学术机构
UC Berkeley BAIR - bair.berkeley.edu/blog
- 机器人、RL、NLP 等多领域覆盖
Stanford HAI - hai.stanford.edu/news
- 以人为本的 AI 研究与政策
MIT CSAIL - csail.mit.edu/news
- 计算机科学与 AI 前沿
Mila (Montreal) - mila.quebec/en/blog
- Bengio 领导,深度学习理论与因果推理
上海AI Lab - shlab.org.cn/news
- 书生多模态大模型与开源生态
清华AI研究院 - air.tsinghua.edu.cn
- 中国 AI 学术前沿,产学研结合
Distill - distill.pub
- 交互式论文,可视化解释复杂概念
五、学习路径推荐
🌱 初学者(0-6个月)
- 基础概念:Jay Alammar 图解系列 → Chris Olah 可视化教程
- 代码实践:Andrej Karpathy 教程 → Hugging Face 文档
- 系统学习:Lilian Weng 综述 → Sebastian Ruder NLP News
- 中文资源:通义千问博客 → 智谱AI技术文档
🌿 进阶研究者(6-18个月)
- 架构深入:Yi Tay 架构分析 → Jason Wei 涌现能力
- 安全对齐:Chris Olah 可解释性 → Neel Nanda 机制解释
- 工程优化:Tim Dettmers 量化 → Chip Huyen MLOps
- 中文前沿:Qwen 技术博客 → DeepSeek MoE 架构
🌳 专家级(18个月+)
- 理论前沿:Geoffrey Hinton、Yoshua Bengio、Yann LeCun 三巨头
- AGI探索:Ilya Sutskever、Demis Hassabis、François Chollet
- 对齐研究:Jan Leike、Evan Hubinger、Alignment Forum
- 产业实践:各大公司官方博客 → 创业公司技术博客
六、按角色推荐
AI 应用工程师
- 必读:Lilian Weng(全局认知)
- 精读:Sophia Yang、Eugene Yan(RAG/Agent构建)
- 参考:Tim Dettmers(部署成本优化)
模型算法研究员
- 必读:Yi Tay、Jason Wei(架构与Prompt范式)
- 精读:Chris Olah、Neel Nanda(理论突破线索)
- 参考:Albert Q. Jiang(推理能力边界)
技术管理者(CTO/VP)
- 必读:Greg Brockman、Chip Huyen(团队与基础设施)
- 精读:Yann LeCun、François Chollet(保持清醒认知)
- 参考:Sebastian Ruder(行业趋势追踪)
AI 安全研究员
- 必读:Chris Olah、Neel Nanda(可解释性)
- 精读:Jan Leike、Evan Hubinger(对齐理论)
- 参考:Nelson Elhage(系统安全)
中文 NLP 研究者
- 必读:Qwen 团队(开源大模型)
- 精读:智谱AI、Kimi 团队(中文技术)
- 参考:字节 AI Lab(工业应用)
七、特殊主题资源
AI 安全与对齐
- Alignment Forum - AI 对齐社区核心讨论平台
- AI Safety Support - AI 安全职业与学习资源
- 80,000 Hours AI Safety - AI 安全职业指南
开源工具与平台
- Hugging Face - 开源模型与数据集中心
- Papers With Code - 论文代码实现索引
中文 AI 社区
- 机器之心 - 中文 AI 资讯与技术解读
- PaperWeekly - 中文论文解读社区
视频教程
- Andrej Karpathy YouTube - 深度学习教学视频
- 3Blue1Brown - 数学与神经网络可视化
持续学习建议
- 每周阅读:订阅 Sebastian Ruder 的 NLP News、Lilian Weng 的新文章
- 每月深入:精读 1-2 篇长文,做笔记和代码复现
- 每季度回顾:关注 OpenAI、DeepMind、Anthropic 的重大发布
- 关注中文生态:跟踪 Qwen、智谱、Kimi 等国内团队的技术进展
- 参与社区:Hugging Face、GitHub、Alignment Forum 等平台互动
- 批判性思考:阅读 Yann LeCun、François Chollet 等人的反思文章
最后更新:2025年12月4日
维护者:向阳乔木 | 🌐 www.qiaomu.ai | 🐦 @vista8
贡献:欢迎提交 PR 补充更多优质资源

浙公网安备 33010602011771号