DeepSeek时代下工程师如何借力AI突围——InfoQ报告总结
DeepSeek 时代下工程师如何借力 AI 突围——InfoQ 报告总结
来源:InfoQ - DeepSeek 时代下工程师如何借力 AI 突围?
演讲者:彭靖田(上海载极数据科技创始人/CEO,谷歌开发者专家)
会议:QCon 全球软件开发大会(北京站)2025-09-26
主题:AI 时代下的企业人才管理体系
核心议题
本次分享探讨了三个核心问题:
- AI 是否会取代程序员?
- 会用 AI 的程序员是否会取代不会用的?
- 企业是否会用外部供应商取代内部研发团队?
一、DeepSeek 爆火的现象与本质
现象级数据
- 7 天达到 1 亿用户:改写 ChatGPT 两个月达到 1 亿用户的记录
- 政治高度:
- 2025年1月20日:梁文峰在总理座谈会发言,同日 R1 发布
- 2月17日:最高级别民营企业家会议,梁文峰坐第一排(紧邻马化腾)
四大核心优势
| 维度 | 具体表现 |
|---|---|
| 技术能力 | 在推理大模型赛道领先,逼得 OpenAI 和 LLaMA 动作变形 |
| 开源战略 | 免费开源,争夺 AI 技术标准制定权(如 TCP/IP、HTTP 协议) |
| 低成本 | 被称为"大模型界的拼多多",迫使 LLaMA 4 采用 MoE 架构 |
| 国产化 | 解决政企数据安全顾虑,推动国产半导体(如沐曦 GPU、华为昇腾)销量增长 |
国产化意义
- 数据主权:邮储银行等金融机构不敢用海外模型(包括开源的 LLaMA)
- 产业链拉动:上海沐曦 GPU 完成上市辅导,华为昇腾销量增长近 10 倍
- 生态建设:为国内智能体生态和大模型应用提供基础
二、DeepSeek 技术演进与竞争态势
版本发展时间线
2024 Q1-Q2: V1 版本发布
2024.05: V2 版本(MoE 架构)超越 Mixtral
2024.12: V3 版本与 GPT-4O、Claude 3.5、LLaMA 3.1 竞争
2025.01.20: R1 版本赶超 OpenAI GPT-O1
2025.03.24: V3 更新(160→256 专家,低精度训练)
2025.04.06: Meta LLaMA 4 跟进 MoE 架构
关键技术突破
V2 版本(2024.05)
- 创新点:MoE(Mixture of Experts)架构
- 影响:终结"欧洲 OpenAI" Mixtral 的声势
V3 版本(2024.12 → 2025.03)
- 对标对象:LLaMA 3.1(4000亿参数)、GPT-4O、Claude 3.5
- 优势维度:MMLU 语义理解、数学能力等
- 低调更新:3月24日版本未更名,专家数 160→256,采用更低精度
R1 版本(2025.01)
- 训练机制:V3 吐出基础数据集 → R1 Zero → R1(左脚踩右脚式迭代)
- 后训练突破:强化学习 + SPCT 方法解决 Reward Model 构建难题
- 蒸馏系列:
- DeepSeek-R1(满血版)
- DeepSeek-R1-Distill-Qwen-32B(企业常用)
- DeepSeek-R1-67B(平衡性能与速度)
竞品动态对比
| 时间 | DeepSeek | OpenAI | Meta | |
|---|---|---|---|---|
| 2025.01.20 | R1 发布 | - | - | - |
| 2025.03.24 | V3 更新(256专家) | - | - | - |
| 2025.03.25 | - | - | Gemini 2.5 Pro 发布 | - |
| 2025.03.26 | - | GPT-4O 紧急发布(抢风头) | - | - |
| 2025.04.06 | - | - | - | LLaMA 4 跟进 MoE |
观察:
- OpenAI 节奏混乱,GPT-5 推迟
- Google 像"大模型界的汪峰",发布时总被抢风头
- Meta 开始拥抱 MoE 架构降成本
三、企业人才价值链重构
双向选择的本质对齐
人才视角 ↔️ 企业视角
【人才诉求】 【企业诉求】
个人发展 ←→ 战略执行(KPI/OKR 对齐)
技能提升 ←→ 团队协作(1+1>2 的效能)
薪酬回报 ←→ 价值创造(业绩驱动)
三大核心对齐
-
目标对齐
- 个人发展方向与企业战略一致
- 通过 KPI/OKR 实现目标同步
- 避免自由生长式的无效努力
-
技能对齐
- 从"八仙过海各显神通"到"团队协作互补"
- 企业更看重团队整体效能而非个人技能深度
- 能够协作甚至调度专家的能力更有价值
-
业绩对齐
- VC 时代结束,不能靠融资随意涨薪
- 只有创造实际价值才能获得薪酬回报
- 企业焦虑:100人团队每天工资成本vs产出价值
企业考核逻辑转变
传统模式:100% 个人自由发挥
大模型时代:20% 自由增长 + 80% 公司目标对齐
四、AI 在人才管理全流程的应用
招聘环节:AI vs AI
候选人侧
- 笔试:多个大模型同时回答 → 整合答案提交
- 面试:AI 辅助回答更全面,提升通过率
企业侧应对
- 笔试:AI 出题 → AI 评审报告
- 面试:数字人面试官
- 结果:不会用 AI 的候选人在此环节被淘汰
培养与发展
企业痛点
- "四月之痒":年终奖后离职潮(类似婚姻"七年之痒")
- 培养需求:自己培养的人才更了解公司文化
解决方案
- 个性化培训计划
- 完整评估流程
- 工具推荐:极客时间企业版
️ 五、如何成为不被 AI 取代的工程师
三大核心策略
1️⃣ 把 AI 当工具(像手机一样)
- 心态:AI 不神奇也不可怕,只是工具
- 行动:用 AI 解决问题,提升效率
- 量化:企业可能要求 AI 使用率/覆盖率达标
2️⃣ 终身学习
- 现实:大学知识大多已忘,更多在社会大学学习
- 挑战:
- 信息迭代极快,知识有效期短(某些只有几天)
- 特定大模型的提示词可能下月失效
- 新工具:MCP、AtoA 等不断涌现
3️⃣ 协同共生系统
- 个人层面:与 AI、与团队协作
- 企业层面:用 AI 高效筛选和保留优秀人才
六、中国 AI 下半场的战略机会
陆奇老师观点(奇绩创坛内部分享)
技术维度
上半场:知识驱动的大模型(已结束)
下半场:推理驱动的模型(刚开始)
中国在推理驱动领域有先发优势(R1 领先)
生态优势
| 优势 | 具体表现 |
|---|---|
| 勤奋文化 | 创新迭代速度快 |
| 数据环境 | 无 GDPR 限制,数据使用灵活 |
| 政策支持 | 硬件、招商引资力度大 |
| 创新生态 | 更多创新可能性 |
七、关键洞察与建议
对个人的启示
-
认知升级
- 了解宏观技术趋势,知道巨人已达到的高度
- 站在巨人肩膀上进行应用开发
-
能力建设
- 学习 AI 全栈:从应用层到算力层
- 了解企业评价机制,善用机制优化表现
-
职业定位
- 不仅会技术,还要会协作、会创造价值
- 从技术专家走向能调度专家的角色
对企业的启示
-
招聘策略
- AI 辅助筛选(AI vs AI)
- 重视候选人的 AI 应用能力
-
培养体系
- 个性化培训 + 评估流程
- 内部提效,量化 AI 使用率
-
考核机制
- 20% 自由增长 + 80% 目标对齐
- 业绩驱动薪酬,价值创造导向
推荐资源
论文与技术
- 强化学习在大模型训练中的应用(R1 已验证可行性)
- Post Training 的 SPCT 方法(解决 Reward Model 构建难题)
- LMSYS 榜单(Stanford、UCSD 等高校非营利组织,相对严肃)
课程推荐
- 《AI 全栈开发实战营训练营》(极客时间 - 彭靖田)
- 覆盖:应用层 → 算力层四个技术层次
- 适合:AI 开发入门 + 企业 AI 推动实践
核心结论
三个"取代"的答案
-
AI 会取代程序员吗?
- 不会,但会取代不会用 AI 的程序员
-
会用 AI 的程序员会取代你吗?
- 会,从招聘环节就开始竞争
-
企业会用外部供应商取代内部团队吗?
- 取决于团队能否创造价值、与战略对齐
生存法则
个人:AI 工具化 + 终身学习 + 协同共生
企业:目标对齐 + 技能对齐 + 业绩对齐
行业:拥抱推理驱动时代的中国机会
演讲者简介
彭靖田
- 上海载极数据科技创始人/CEO
- 谷歌开发者专家、谷歌出海创业加速器导师
- 连续创业者:3家公司成功退出(字节收购)
- 华为 2012 实验室深度学习团队成员
- Linux 云原生基金会(CNCF)程序委员会成员
- 著作:《深入理解 TensorFlow》
- 课程:《企业级 Agents 实战营》《AI 大模型应用开发营》《AI 大模型微调训练营》
报告生成时间:2025-10-04
信息来源:InfoQ - QCon 全球软件开发大会(北京站)
版权声明:文章版权归极客邦科技 InfoQ 所有

浙公网安备 33010602011771号