# InfoQ 2025 AI-ML技术趋势报告:从物理AI到Agent革命的技术演进图景
InfoQ 2025 AI/ML技术趋势报告:从物理AI到Agent革命的技术演进图景
报告来源:InfoQ Editorial Team
发布时间:2025年9月24日
核心主题:AI、ML、数据工程领域的技术趋势与采用阶段分析
报告链接:https://www.infoq.com/articles/ai-ml-data-engineering-trends-2025/
报告概述
本报告基于 Geoffrey Moore 的《跨越鸿沟》理论框架,将 AI/ML 技术分为四个采用阶段:创新者(Innovators)→ 早期采用者(Early Adopters)→ 早期大众(Early Majority)→ 晚期大众(Late Majority)。
报告核心价值:
- ✅ 识别新兴技术趋势和成熟技术
- ✅ 为技术选型提供决策依据
- ✅ 了解技术采用的生命周期阶段
- ✅ 预测未来12个月的技术发展方向
核心趋势洞察(Key Takeaways)
1. 物理AI(Physical AI)- 下一个技术前沿
定义:AI 技术从数字世界走向物理世界的革命性转变
典型应用:
- 机器人技术
- 自动驾驶
- 工业自动化
- 医疗设备
意义:AI 不再仅仅是软件,而是能够感知和操纵物理世界的系统
2. RAG已成为商品化技术
现状:检索增强生成(RAG)技术在企业应用中快速普及
采用情况:
- ✅ 文档知识库检索
- ✅ 企业知识管理系统
- ✅ 智能客服系统
- ✅ 内部文档问答
趋势判断:从创新技术 → 标准配置
3. AI从助手到共创者的角色转变
传统模式:AI 作为辅助工具加速代码编写
新兴模式:AI 作为开发团队成员参与整个软件生命周期
能力演进:
代码补全 → 代码生成 → 应用开发 → 测试部署 → 全流程参与
影响:软件开发范式的根本性变革
4. AI驱动的DevOps
核心特点:将 AI 能力集成到 DevOps 流程的各个环节
应用场景:
- 自动化测试生成
- 智能故障诊断
- 性能优化建议
- 部署策略优化
关注度:2025年重点关注领域
5. 人机交互的新范式
核心原则:技术必须映射到真实的人类需求
设计思路:
- 理解技术如何融入人们的生活
- 围绕人类需求设计交互方式
- 避免为技术而技术
实践建议:将所有研发目标与真实人类需求对齐
6. 新协议推动互操作性
核心协议:
- MCP(Model Context Protocol):模型上下文协议
- A2A(Agent-to-Agent):Agent间通信协议
价值:
- 打破AI应用与后端系统的壁垒
- 实现不同AI系统间的协同
- 构建标准化的AI生态
预期:持续发展并提升互操作性
技术采用阶段详解
创新者阶段(Innovators)
这个阶段的技术处于探索期,适合技术前瞻者关注和实验。
本年度新增技术
1. AI Agents(AI代理)
定义:能够自主完成任务的 AI 程序,具备规划、执行、学习能力
特点:
- 自主决策:无需人工干预完成复杂任务
- 工具调用:可以使用外部工具和API
- 上下文理解:保持对话上下文和任务状态
- 多步推理:能够分解和执行复杂的多步骤任务
应用场景:
- 客户服务自动化
- 研究助手
- 代码审查助手
- 业务流程自动化
发展趋势:
从简单的对话助手 → 能够执行复杂业务流程的智能代理
2. Physical AI(物理AI)
核心概念:AI与物理世界的深度融合
技术组成:
感知层(传感器)→ 决策层(AI模型)→ 执行层(机器人/设备)
应用领域:
| 领域 | 应用示例 | 成熟度 |
|---|---|---|
| 机器人 | 仓储物流机器人 | 中等 |
| 自动驾驶 | L4级自动驾驶 | 较高 |
| 工业制造 | 智能装配线 | 中等 |
| 医疗健康 | 手术机器人 | 较低 |
挑战:
- ⚠️ 安全性要求极高
- ⚠️ 实时响应要求
- ⚠️ 物理环境的不确定性
- ⚠️ 法律法规限制
未来预测:下一个技术前沿,将引发工业和服务业革命
3. AI-Enhanced Coding Tools(AI增强编码工具)
代表产品:
- GitHub Copilot
- Cursor
- Claude with Code
- Amazon CodeWhisperer
能力演进:
第一阶段:代码补全
输入函数名 → AI生成函数体
第二阶段:代码生成
自然语言描述 → AI生成完整功能代码
第三阶段:共创开发(当前正在发生)
需求 → AI规划架构 → AI编写代码 → AI编写测试 → 部署
关键引用:
"We're not just writing code faster, we're entering a phase where the entire application can be developed, tested and shipped with the AI as part of the development team."
对开发者的影响:
- ✅ 提升开发效率
- ✅ 降低重复工作
- ⚠️ 需要新的技能组合(AI协作能力)
- ⚠️ 对代码质量把控要求更高
4. AI-Driven DevOps
核心理念:将AI能力嵌入DevOps生命周期的每个环节
应用矩阵:
| DevOps阶段 | AI应用 | 价值 |
|---|---|---|
| 规划 | 需求分析、工作量预估 | 提升规划准确性 |
| 开发 | 代码生成、Code Review | 提升代码质量 |
| 构建 | 依赖优化、编译优化 | 缩短构建时间 |
| 测试 | 自动生成测试用例 | 提升测试覆盖率 |
| 部署 | 智能发布策略 | 降低发布风险 |
| 监控 | 异常检测、根因分析 | 快速定位问题 |
2025年关注焦点:
- 自动化测试生成:基于代码自动生成测试用例
- 智能故障诊断:从日志和指标中自动识别问题
- 性能优化建议:AI分析性能瓶颈并给出优化方案
5. Multimodal AI(多模态AI)
定义:能够处理和生成多种类型数据的AI系统(文本、图像、音频、视频)
技术进展:
- 图文混合理解
- 视频内容分析
- 语音+文本+图像综合处理
代表模型:
- GPT-4V(Vision)
- Gemini(Google)
- Claude 3(Anthropic)
应用方向:
- 视频RAG:从视频中提取信息并回答问题
- 创意生成:基于多模态输入的内容创作
- 数据分析:分析包含多种格式的复合数据
未来预测:
"We'll have long form videos and it'll become a challenge to differentiate between a human generated video and AI generated video."
早期采用者阶段(Early Adopters)
这些技术已经过验证,开始在企业中落地应用。
从创新者晋升到早期采用者
1. AI Agents → 已晋升 ✅
晋升原因:
- 技术框架逐渐成熟
- 企业应用案例增多
- 开发工具生态完善
当前状态:
- ✅ 框架可用性提升
- ✅ 实际应用案例增多
- ⚠️ 仍需技术积累
2. Retrieval Augmented Generation (RAG) → 已晋升 ✅
晋升原因:RAG从技术创新走向商品化
采用现状:
典型场景:
-
企业知识库
- 内部文档检索
- 政策规范查询
- 技术文档问答
-
客户服务
- 智能客服系统
- 产品知识库
- FAQ自动回答
-
研究辅助
- 论文检索与总结
- 技术报告分析
- 专利信息检索
关键引用 - Anthony Alford:
"These things are really becoming commonplace... any business that has a big document database, bunch of knowledge articles and things like that, they're going to be looking at this."
创新应用 - Savannah Kunovsky 的设计实践:
"Because of the existence of RAG, we are now able to build systems that actually allow us to gain a ton of context before we start designing. If we're able to access more documents that can give us that information, then it kind of gives our designers and our design teams the ability to work from a good set of information rather than starting from zero."
价值升级:
技术工具 → 业务赋能 → 非技术人员也能使用的标准能力
商品化标志:
- ✅ 成熟的开源框架(LangChain, LlamaIndex)
- ✅ 云服务商提供托管服务
- ✅ 企业级产品大量出现
- ✅ 降低了技术门槛
3. Automated Machine Learning (AutoML) → 已晋升 ✅
定义:自动化机器学习模型的选择、训练、优化过程
成熟度表现:
- ✅ 在各类组织中广泛使用
- ✅ 技术框架成熟稳定
- ✅ 降低了机器学习门槛
主流平台:
- Google AutoML
- Azure AutoML
- H2O.ai
- DataRobot
适用场景:
- 快速原型验证
- 非ML专家的建模需求
- 标准化建模流程
早期大众阶段(Early Majority)
这些技术已经成熟,正在被主流企业采用。
本年度晋升技术
1. Vector Databases(向量数据库)
定义:专门用于存储和检索高维向量数据的数据库
核心能力:
- 相似度搜索:快速找到语义相似的内容
- 高维数据处理:处理embedding向量
- ⚡ 高性能检索:毫秒级响应时间
主流产品:
| 产品 | 类型 | 特点 |
|---|---|---|
| Pinecone | 云服务 | 全托管,易用 |
| Weaviate | 开源 | 支持多种向量索引 |
| Milvus | 开源 | 高性能,云原生 |
| Qdrant | 开源 | Rust实现,高效 |
| Chroma | 开源 | AI-native设计 |
应用场景:
- RAG系统的核心组件
- 推荐系统
- 语义搜索
- 图像检索
成熟度标志:
- ✅ 多个稳定的商业产品
- ✅ 大规模生产环境验证
- ✅ 完善的工具生态
- ✅ 成为AI应用的标配
2. MLOps(机器学习运维)
定义:将DevOps理念应用到机器学习生命周期管理
核心流程:
数据管理 → 模型训练 → 模型评估 → 模型部署 → 监控反馈 → 持续迭代
主要工具:
- 实验管理:MLflow, Weights & Biases
- 模型部署:Seldon, KServe
- 特征存储:Feast, Tecton
- 流程编排:Kubeflow, Airflow
成熟标志:
- ✅ 各组织建立MLOps团队
- ✅ 标准化的工具链
- ✅ 最佳实践广泛传播
- ✅ 云厂商提供一站式平台
价值:
- 提升模型部署效率
- 保证模型质量稳定性
- 实现模型的可追溯性
- 降低模型运维成本
3. Synthetic Data(合成数据)
定义:通过算法生成的人工数据,用于训练和测试AI模型
应用场景:
- 隐私保护:替代真实敏感数据
- 数据增强:扩充训练数据集
- 边界测试:生成极端场景数据
- 冷启动:在数据稀缺时启动项目
生成方法:
- 规则生成
- GAN生成
- 变分自编码器
- 数据变换
成熟度表现:
- ✅ 成熟的生成工具
- ✅ 质量评估标准建立
- ✅ 法律合规性明确
- ✅ 企业广泛采用
挑战:
- ⚠️ 数据质量保证
- ⚠️ 分布偏差问题
- ⚠️ 监管合规要求
晚期大众阶段(Late Majority)
这些技术已经完全成熟,成为企业核心架构的一部分。
本年度晋升技术
1. Lakehouses(湖仓一体)
定义:融合数据湖和数据仓库优点的新一代数据架构
核心特点:
数据湖的灵活性 + 数据仓库的性能 = Lakehouse
技术优势:
- ✅ 存储成本低(对象存储)
- ✅ 支持多种数据格式
- ✅ ACID事务保证
- ✅ 高性能查询
主流平台:
- Databricks Delta Lake
- Apache Iceberg
- Apache Hudi
成熟标志:
- ✅ 大厂全面采用
- ✅ 开源生态完善
- ✅ 成为数据架构标准
- ✅ 替代传统数仓
2. Stream Processing(流处理)
定义:实时处理连续数据流的技术
核心框架:
- Apache Kafka:分布式流平台
- Apache Flink:流批一体处理
- Apache Storm:实时计算
- Apache Pulsar:云原生消息流
应用场景:
| 场景 | 案例 |
|---|---|
| 实时监控 | 系统指标、业务指标 |
| 事件驱动 | 订单处理、支付通知 |
| 实时分析 | 用户行为、异常检测 |
| 数据同步 | CDC、数据集成 |
成熟标志:
- ✅ 成为企业标准组件
- ✅ 大规模生产验证
- ✅ 完善的运维工具
- ✅ 云原生支持
3. Distributed Computation(分布式计算)
代表技术:
- Apache Spark:大规模数据处理
- Apache Storm:实时流计算
- Apache Hadoop MapReduce:批处理计算
演进历程:
单机计算 → 集群计算 → 云原生分布式 → Serverless计算
当前状态:
- ✅ 完全成熟的技术
- ✅ 企业核心基础设施
- ✅ 转向云原生和Serverless
- ✅ 与AI/ML深度融合
未来12个月预测
InfoQ团队对未来一年的技术发展给出了以下预测:
1. AI Agents持续爆发
预测:
- AI Agent和AI增强编码工具将持续高速发展
- 更多企业级Agent框架出现
- Agent之间的协作能力增强
影响:
- 软件开发流程重构
- 新的商业模式出现
- 开发者技能要求变化
2. 真正有用的技术将脱颖而出 ⭐
预测:
"We're going to see the things that are truly useful to people as the things that set the new precedent for the next foundations of the internet."
核心判断:
- 用户价值成为技术筛选标准
- 炒作型技术逐渐消退
- 实用性技术获得长期发展
3. 视频RAG兴起
预测:
- 长视频内容的RAG应用将成为新挑战
- AI生成视频 vs 人类视频的辨别将变得困难
技术挑战:
- 视频内容的理解和索引
- 多模态信息的融合
- 计算成本优化
应用场景:
- 在线教育平台
- 视频会议记录
- 影视内容分析
4. AI泡沫讨论升温
预测:
"We'll start talking about the AI bubble, not that the technology is not going to work because the technology is here and the technology is going to stay, but more regarding the industry itself."
核心观点:
- ✅ 技术本身没有泡沫:AI技术是真实有效的
- ⚠️ 产业存在泡沫:过度投资、估值虚高、应用脱节
可能后果:
- 投资回归理性
- 淘汰无价值应用
- 聚焦实际问题解决
借鉴历史:
互联网泡沫(2000) → 真正有价值的公司存活并壮大
AI泡沫(2025?) → 真正有价值的AI应用将继续发展
5. AI成为生活的隐形部分
预测:
- AI将更加无缝地融入日常生活
- 交互方式更加自然和基于上下文
- AI在后台默默工作,而非显式的助手
交互演进:
命令式交互 → 对话式交互 → 上下文感知 → 主动预判
典型场景:
- 智能家居自动调节
- 无感知的内容推荐
- 后台智能化决策
设计哲学:
- 将AI能力嵌入产品体验
- 避免"AI作为卖点"的设计
- 聚焦解决问题而非展示技术
对技术决策者的启示
1. 技术选型建议
可以放心采用(晚期大众/早期大众)
- 数据基础设施:Lakehouse、流处理、分布式计算
- ML基础设施:MLOps、Vector DB
- 数据策略:合成数据
✅ 理由:技术成熟、生态完善、风险可控
积极探索但需评估(早期采用者)
- AI应用开发:RAG、AI Agents
- 开发工具:AutoML
⚠️ 建议:
- 小范围试点验证价值
- 建立技术储备和团队能力
- 关注最佳实践
关注趋势但谨慎投入(创新者)
- 前沿技术:Physical AI、多模态AI
- 新兴实践:AI驱动DevOps
- 开发范式:AI共创式开发
⚠️ 建议:
- 保持技术敏感度
- 实验性项目探索
- 不作为核心依赖
2. 能力建设建议
组织层面
-
建立AI能力中心
- 统一技术选型和标准
- 沉淀最佳实践
- 提供内部咨询和支持
-
培养AI素养
- 技术团队掌握AI开发能力
- 业务团队理解AI应用场景
- 管理层理解AI战略价值
-
建设数据基础设施
- 数据湖仓一体架构
- 向量数据库部署
- MLOps流程规范
个人层面
-
技术专家
- 深入学习RAG和Agent技术
- 掌握AI开发工具链
- 关注Physical AI动向
-
工程师
- 学会与AI工具协作开发
- 提升代码质量把控能力
- 理解AI系统的局限性
-
架构师
- 设计AI-Native架构
- 理解AI技术选型trade-off
- 关注AI互操作性协议
3. 风险提示
⚠️ 技术风险
- 过度依赖AI:忽视传统方法的价值
- 技术债务:快速迭代导致的质量问题
- 安全风险:AI系统的漏洞和攻击面
⚠️ 组织风险
- 技能gap:团队能力跟不上技术发展
- 文化冲突:传统开发模式 vs AI辅助开发
- 投资浪费:盲目追逐热点技术
⚠️ 战略风险
- AI泡沫:过度投资于不成熟技术
- 路径依赖:锁定在特定AI平台
- 价值错位:技术导向而非问题导向
深度思考:技术采用的智慧
跨越鸿沟的关键
Geoffrey Moore的核心洞察:
创新技术在"早期采用者"和"早期大众"之间存在巨大鸿沟
成功跨越的标志:
- ✅ 完整产品:不仅是技术demo,而是完整解决方案
- ✅ 主流需求:解决普遍问题而非小众需求
- ✅ 降低门槛:技术复杂度对用户透明
- ✅ 生态支持:工具链、最佳实践、社区完善
AI技术的跨越路径:
技术概念 → 开源框架 → 商业产品 → 平台服务 → 基础设施
技术趋势的辨别能力
真实趋势的特征
- ✅ 解决真实问题:有明确的应用价值
- ✅ 技术可行性:不依赖突破性发现
- ✅ 经济可行性:成本可控、ROI清晰
- ✅ 生态支持:多方参与、标准化
炒作型趋势的特征
- ❌ 技术导向:为了技术而技术
- ❌ 概念模糊:缺乏清晰定义
- ❌ 案例匮乏:缺少成功应用
- ❌ 成本高昂:投入产出比不合理
中国技术环境的特殊考量
需要额外关注的因素
-
数据合规
- 数据出境限制
- 个人信息保护法
- 网络安全法要求
-
技术自主
- 国产替代趋势
- 供应链安全
- 开源合规风险
-
场景差异
- 中国特色业务场景
- 用户行为差异
- 监管环境不同
-
生态差异
- 国内外工具链差异
- 社区支持力度
- 云服务能力
延伸阅读与资源
原文链接
InfoQ AI, ML and Data Engineering Trends Report - 2025
相关报告
技术深入资源
- AI Agents:LangChain Agents
- RAG:LlamaIndex Documentation
- Vector DB:Vector Database Benchmark
- MLOps:ML Engineering Book
相关书籍
- 《Crossing the Chasm》by Geoffrey Moore - 技术采用生命周期理论
- 《Building LLM Powered Applications》- AI应用开发实践
- 《Machine Learning Design Patterns》- ML系统设计模式
️ 报告元数据
报告标签:#AI趋势 #ML #技术采用 #InfoQ #2025预测 #RAG #AI_Agents #物理AI #技术选型
报告类型:行业趋势分析报告
参考价值:⭐⭐⭐⭐⭐
适用人群:
- 技术管理者(CTO、技术VP)
- 架构师和技术专家
- AI/ML工程师
- 产品经理和创业者
更新周期:年度报告,建议每年回顾
时效性:2025年9月发布,预测未来12个月趋势
使用建议:
- 将本报告作为技术选型的参考框架
- 定期对照报告检查技术布局的合理性
- 关注从"早期采用者"到"早期大众"的技术(价值最大)
- 避免盲目追逐"创新者"阶段的技术
- 结合自身业务场景做出独立判断
⚠️ 批判性提醒:
- 技术趋势报告反映行业共识,但不代表绝对正确
- 中国技术环境有特殊性,需结合本土实际
- 技术选型应基于业务价值,而非趋势追逐
- 保持怀疑精神,用实践检验理论

浙公网安备 33010602011771号