InfoQ AI、ML与数据工程趋势报告2025——技术采用周期全景分析

关联知识库：InfoQ AI、ML与数据工程趋势报告2025——技术采用周期全景分析

InfoQ AI、ML 与数据工程趋势报告 2025——技术采用周期全景分析

来源：InfoQ - AI, ML and Data Engineering Trends Report - 2025
发布时间：2025年9月24日
作者团队：Srini Penchikala、Savannah Kunovsky、Anthony Alford、Daniel Dominguez、Vinod Goje
阅读时长：18分钟

执行摘要

本报告基于 Geoffrey Moore《跨越鸿沟》 的技术采用周期理论，将 AI/ML 技术分为四个阶段：创新者（Innovators）、早期采用者（Early Adopters）、早期大众（Early Majority）、晚期大众（Late Majority）。InfoQ 编辑团队通过播客访谈和专家研讨，梳理了 2025 年 AI 技术领域的关键趋势和未来 12 个月的技术走向。

核心洞察（Key Takeaways）

#	核心观点	影响程度
1	物理 AI（Physical AI）是 AI 技术的下一个前沿	⭐⭐⭐⭐⭐
2	RAG 已成为商品化技术，在企业应用中广泛采用	⭐⭐⭐⭐⭐
3	AI 从"助手"转变为"共同创造者"，整个应用可由 AI 参与开发、测试和交付	⭐⭐⭐⭐⭐
4	AI 驱动的 DevOps 流程和实践受到广泛关注	⭐⭐⭐⭐
5	人机交互（HCI）需将技术目标与人类真实需求对齐	⭐⭐⭐⭐
6	MCP 和 A2A 等新协议提供 AI 应用与后端系统的互操作性	⭐⭐⭐⭐⭐

技术采用周期全景图

2025 年趋势图变化亮点

创新者阶段新增：
├─ AI Agents
├─ 多模态语言模型
├─ 物理 AI
├─ MCP（模型上下文协议）
├─ 人机交互（HCI）
├─ 推理模型
└─ AI DevOps

早期采用者：
├─ 语言模型创新（LLM）
│   ├─ GPT-5
│   ├─ 视觉 LLM（VLM）
│   ├─ 小型语言模型（SLM）
│   └─ 状态空间模型（SSM）
└─ RAG（检索增强生成）

早期大众：
├─ Vector DBs（向量数据库）
├─ MLOps
└─ Synthetic Data（合成数据）

晚期大众：
├─ Lakehouses
├─ Stream Processing（流处理）
└─ Distributed Computation（分布式计算）

一、创新者阶段（Innovators）

1.1 AI Agents（人工智能代理）

重大进展

Anthropic：Claude Subagents 发布
Amazon：Bedrock Agents 发布
OpenAI：Generalist ChatGPT Agent（与电子表格、演示应用协同）
Amazon 开源：Strands Agents SDK
NVIDIA：Visual AI Agents（视频分析解决方案）

技术演进

过去：执行单一任务
现在：复杂系统级协同
├─ 工作流中的链式任务协调
├─ 基于情境的自主决策
└─ 跨服务/系统的集成能力

专家观点

Daniel Dominguez（SamXLabs 管理合伙人）：

AI 代理不再只是与聊天机器人互动，现在它们可以帮助我们预订会议、更新数据库、启动云资源。Amazon Bedrock Agents 让我们能够在任何基础模型之上构建生产就绪的代理，无需管理基础设施。它们可以链接任务、AWS 服务并安全地解释数据。

Anthony Alford（Genesys 高级开发总监）：

这些代理就像所有东西一样，是一把双刃剑，既强大又实用，但也有点危险。一个可以调用工具的 LLM，包括文件系统操作，可能会尝试 "rm -rf"。当 AI 可以擦除硬盘、访问银行账户时，AI 安全变得尤为重要。

实际应用案例

Amazon Q 命令行：自动生成 shell 脚本（例如："找到这个文件夹中的所有图像文件，然后放大它们"）
生产级部署：AWS、Google、Azure 均提供代理创建平台

1.2 多模态语言模型（Multimodal LLMs）

核心能力

多模态 = 文本 + 图像 + 音频 + 视频

训练数据类型     →  能力提升
────────────────────────────────
文本 + 图像       →  视觉理解
文本 + 音频       →  语音交互
文本 + 视频       →  动态场景理解
全模态融合        →  跨模态关联推理

价值体现

更深入的理解：跨数据类型关联
更丰富的见解：多维度信息融合
更相关的结果：情境感知增强

1.3 物理 AI（Physical AI）⭐⭐⭐⭐⭐

定义

物理 AI = AI 在机器人身上的体现

设备端语言模型 + 机器人技术 = 物理世界的智能交互

重大发布

公司	产品	特性
Google	Gemma 3n	针对手机、笔记本、平板优化的生成式 AI 模型
Microsoft	Mu	Windows 设置的轻量级设备端 SLM，卸载到 NPU，每秒响应 >100 token
Google	Gemini Robotics On-Device	视觉语言动作（VLA）模型，在机器人设备本地运行
NVIDIA	三机解决方案	DGX（训练）+ Omniverse/Cosmos（模拟）+ Jetson AGX Thor（推理）

NVIDIA 物理 AI 完整解决方案

训练阶段：NVIDIA DGX AI 超级计算机
    ↓
模拟阶段：NVIDIA RTX PRO 服务器 + Omniverse + Cosmos
    ↓
推理阶段：NVIDIA Jetson AGX Thor
    ↓
部署：完整的物理 AI 系统

专家洞察

Savannah Kunovsky（IDEO 新兴技术董事总经理）：

边缘计算对于物理 AI 尤为重要。当我们开始在人们家中捕捉真正珍贵而私密的数据时，边缘技术让我们能够设计出值得信赖的体验。数据在本地处理，而不是发送到遥远的、用户不了解的地方。这对于物理 AI 在家庭中的普及至关重要。

Anthony Alford：

推理语言模型是将 LLM 应用于机器人技术的一种途径。NVIDIA 机器人技术总监 Jim Fan 博士说，他相信机器人领域的 GPT-1 已经出现在某篇论文中了，我们只是不知道是哪一篇。他声称，如果没有机器人的实现，我们就不会拥有通用人工智能（AGI）。

1.4 模型上下文协议（MCP）⭐⭐⭐⭐⭐

基本信息

发布方：Anthropic
发布时间：2024年11月
定位：开放标准

核心价值

传统方式：
LLM ←→ 自定义集成1
LLM ←→ 自定义集成2
LLM ←→ 自定义集成3
（碎片化、维护成本高）

MCP 方式：
LLM ←→ MCP 协议 ←→ 统一接口 ←→ 所有外部系统
（标准化、低成本、高复用）

作用机制

MCP 提供了一种 标准化协议，用于：

外部工具与 LLM 的集成
系统数据与 LLM 的共享
数据源与 LLM 的连接

行业采用

✅ OpenAI：集成 MCP 支持
✅ Microsoft：产品中集成 MCP
✅ Google：采用 MCP 标准
✅ 所有主流编码工具：支持 MCP

专家讨论

Anthony Alford：

MCP 无疑已经起飞并被广泛采用。我们讨论的所有编码工具都支持 MCP。MCP 可能是实现代理的关键技术。它的实用性可能在某种程度上受到模型上下文窗口的限制，因为 MCP 中发生的所有事情——输入、输出——都会进入模型上下文。

像 Playwright（用于运行测试的 MCP 服务器）这个看起来是个大赢家。Figma 也有一个，你可以让编码代理在 Figma 中查看模型，然后开始创建。

Daniel Dominguez：

MCP 最令人兴奋的部分在于其 互操作性。有了 MCP，你可以使用 Google 搜索的 Anthropic Claude 模型，或者让 OpenAI 使用你公司的数据。所以现在一切都将在同一个协议下运行。这使其具有可扩展性，也使多智能体系统成为可能——来自不同公司、不同来源的不同智能体协同工作。

实际应用

Playwright MCP 服务器：自动化测试
Figma MCP 集成：编码代理查看设计稿并生成代码
企业数据访问：统一接口访问内部数据源

1.5 人机交互（HCI）

核心理念

将所有研究和工程目标与人类的真正需求对齐，理解这些技术如何融入人们的生活，并为此进行设计。

IDEO 的实践案例

Savannah Kunovsky 分享的设计创新：

案例 1：商业设计师的创新表达

设计师：Tomochini
项目：儿童可持续材料玩具研究

传统方式：
讲故事 → 描述想法 → 展示图片

创新方式：
制作预告片 → 视觉化呈现 → 更有力的表达
商业模式游戏化 → "振动编码"(vibecode) → 可比较的互动体验

案例 2：设计流程的转变

过去：拿出手机 → 停下来 → 靠边停车 → 回复信息
未来：继续日常生活 + 同时处理信息（流畅界面）

Apple Liquid Glass 设计系统

虽然被批评"进化而非革命"，但其理念重要：

流畅界面：信息可以在不同表面流动
情境计算：在需要的地方访问信息（如烹饪台面上显示食谱）
无缝交互：不需要专门拿出设备

麻省理工学院媒体实验室：流畅界面小组

研究方向：如何让技术嵌入到真正需要的地方

设计工具的 AI 应用

IDEO 团队的 AI 工具使用：

工种	AI 工具应用	价值
视觉图形设计师	快速原型、风格探索	提升表达速度
交互设计师	界面生成、交互模拟	快速迭代验证
商业设计师	商业模式游戏化、预告片制作	更有力的沟通
软件设计师	代码生成、架构探索	加速技术实现

共同点：让专注于某一工种的人能够 以前所未有的方式表达想法

1.6 其他创新者阶段技术

推理模型（Reasoning Models）

从知识驱动到推理驱动的转变
更强的逻辑推理和问题解决能力

AI DevOps

AI 驱动的流程自动化
智能运维和性能优化
代码审查和质量保证自动化

二、早期采用者阶段（Early Adopters）

2.1 语言模型创新（LLM Innovations）

OpenAI GPT-5

发布策略变化

传统方式：
用户选择模型 → GPT-4 / GPT-4 Turbo / GPT-4o / o1

GPT-5 创新：
AI 自主选择 → 自动判断用哪个版本（专业版/快速版）

Anthony Alford 的评价：

我其实挺喜欢这一点。OpenAI 在命名他们的模型时有点纠结。他们有一个模型叫 4o，还有另一个叫 o4。这有其逻辑性，但并不总是显而易见。GPT-5 的自主选择是一个有趣的发展。

Savannah Kunovsky 的洞察：

OpenAI 团队意识到，他们实际上需要简化界面，才能打造出真正能引起共鸣、对人们更有用的消费产品。随着大型语言模型的功能成为常态，界面层以及我们如何帮助人们与这些技术互动，将成为企业最重要的差异化因素。

视觉 LLM（VLM）

OpenAI Sora：生成视频的先驱
从文本生成到视频生成的跨越

小型语言模型（SLM）

应用场景：

✅ 设备端推理
✅ 隐私保护应用
✅ 成本敏感部署

其他发展

状态空间模型（SSM）
扩散模型（Diffusion Models）

2.2 检索增强生成（RAG）⭐⭐⭐⭐⭐

技术成熟度

2023：新兴技术
2024：快速增长
2025：商品化（Commodity）

企业采用现状

Anthony Alford：

这些东西确实正在变得司空见惯。在企业软件领域确实正在逐渐普及。任何拥有大型文档数据库、大量知识文章的企业都会关注这一点。

创新应用：设计流程的变革

Savannah Kunovsky 分享 IDEO 的实践：

传统设计调研流程

1. 和企业内部一群人交谈
2. 在线搜索企业经营状况
3. 研究他们正在创造什么
4. 了解重点和 CEO 讯息
5. 从零开始设计

RAG 增强的设计流程

1. 构建 RAG 系统访问企业文档
2. 开始设计前就获得大量背景信息
3. 从丰富的信息库出发开展工作
4. 非技术人员也能轻松创建和使用

价值总结：

RAG 让技术创新开始拥有更多适用于非技术人员的应用。它们不仅提供商业机会，还提供数据可用性。

2.3 自动化机器学习（AutoML）

经历广泛开发和应用
各组织的多个应用程序采用
从创新者晋升到早期采用者

三、早期大众阶段（Early Majority）

技术已跨越鸿沟，进入主流应用

3.1 向量数据库（Vector DBs）

应用场景：语义搜索、RAG 系统、推荐引擎
代表产品：Pinecone、Weaviate、Milvus、Qdrant
成熟标志：企业级部署广泛、工具链完善

3.2 MLOps

定义：机器学习运维（ML + DevOps）
核心能力：
- 模型版本管理
- 自动化训练流水线
- 模型监控和再训练
- A/B 测试和灰度发布
代表工具：MLflow、Kubeflow、SageMaker

3.3 合成数据（Synthetic Data）

应用场景：
- 隐私保护训练
- 数据增强
- 边缘案例模拟
价值：解决真实数据稀缺和隐私问题

四、晚期大众阶段（Late Majority）

技术已完全成熟，成为核心架构模式

4.1 数据湖仓（Lakehouses）

代表产品：Databricks Lakehouse、Snowflake
架构特点：数据湖 + 数据仓库的优势融合
成熟标志：事实标准

4.2 流处理（Stream Processing）

代表产品：Apache Kafka、Apache Flink、Apache Pulsar
应用场景：实时数据处理、事件驱动架构
成熟标志：大规模生产部署

4.3 分布式计算（Distributed Computation）

代表技术：Apache Storm
发展阶段：传统技术，已被新一代技术部分替代
现状：仍在特定场景使用，但不再是主流选择

五、未来预测（团队展望）

5.1 技术趋势预测

预测	时间范围	可能性
AI 代理和 AI 编码工具持续发展	未来 12 个月	⭐⭐⭐⭐⭐
对人们真正有用的技术成为互联网新基础	未来 2-3 年	⭐⭐⭐⭐
视频 RAG 兴起，AI 生成视频难以分辨	未来 12-18 个月	⭐⭐⭐⭐
开始讨论"AI 泡沫"（技术本身会留存）	未来 6-12 个月	⭐⭐⭐
AI 成为生活中更微妙的一部分	持续进行中	⭐⭐⭐⭐⭐

5.2 详细预测分析

预测 1：AI 代理和编码工具

现状：工具爆发期
趋势：整合与标准化
未来：无缝集成到开发流程

预测 2：实用性驱动

核心观点：真正解决问题的技术才会成为下一代互联网基础

预测 3：视频 RAG

技术演进：

文本 RAG（当前）
    ↓
图像 RAG（开始普及）
    ↓
视频 RAG（下一阶段）
    ↓
挑战：区分人类生成 vs AI 生成

预测 4：AI 泡沫讨论

关键区分：

❌ 不是技术泡沫（技术已验证且持续发展）
✅ 是行业泡沫（估值、投资、商业模式）

类似历史：

2000 年互联网泡沫（技术留存，公司洗牌）
AI 可能重演类似模式

预测 5：无处不在的 AI

现在：显性交互（打开 ChatGPT 输入提示）
未来：隐性交互（情境感知、后台运行）

类似演进：
互联网早期：拨号上网，专门"上网"
互联网现在：永久在线，无感知连接

六、关键洞察与启示

6.1 技术选型建议

对于企业决策者

技术阶段	采用策略	风险程度
创新者	小范围试点，关注潜力	高风险高回报
早期采用者	战略性部署，建立优势	中等风险
早期大众	全面推广，标准化实施	低风险
晚期大众	基础设施化，优化成本	极低风险

对于技术团队

创新者阶段技术（如 AI Agents、MCP、物理 AI）：

✅ 建议：保持关注，参与开源贡献
✅ 行动：POC 验证，积累经验
⚠️ 注意：生产部署需谨慎评估

早期采用者技术（如 RAG、LLM）：

✅ 建议：积极采用，建立竞争优势
✅ 行动：生产部署，积累最佳实践
⚠️ 注意：技术仍在快速演进

早期大众技术（如 Vector DBs、MLOps）：

✅ 建议：全面应用，标准化流程
✅ 行动：企业级部署，建立规范
⚠️ 注意：技术成熟但需优化

6.2 人机交互的设计原则

原则 1：以人为中心

❌ 错误：技术驱动设计
✅ 正确：需求驱动设计

问自己：
- 这项技术解决了什么真实问题？
- 它如何融入用户的日常生活？
- 它让生活更简单还是更复杂？

原则 2：隐私与信任

Savannah Kunovsky 的洞察：

当我们开始在人们家中捕捉真正珍贵而私密的数据时，边缘技术让我们能够设计出值得信赖的体验。数据在本地处理，而不是发送到遥远的、用户不了解的地方。

实践建议：

✅ 边缘计算优先
✅ 透明的数据处理流程
✅ 用户可控的隐私设置

原则 3：流畅性与情境感知

理想状态：技术融入生活，而非打断生活

传统：拿出手机 → 解锁 → 打开应用 → 操作 → 锁屏 → 收起
未来：自然的、情境感知的、无感知的交互

6.3 AI 安全考量

代理系统的风险

Anthony Alford 的警告：

当 AI 可以擦除硬盘、访问银行账户时，AI 安全变得尤为重要。这些工具可以让我们的生活变得轻松，但也可能让生活变得非常不愉快。

安全实践框架

第一层：权限控制
├─ 最小权限原则
├─ 操作审计日志
└─ 关键操作人工确认

第二层：沙箱隔离
├─ 文件系统隔离
├─ 网络访问限制
└─ 资源使用限制

第三层：监控与回滚
├─ 实时操作监控
├─ 异常行为检测
└─ 快速回滚机制

MCP 安全问题

已知风险：

MCP 服务器安全问题已被报道
上下文窗口限制（所有 I/O 进入模型上下文）
跨系统访问的权限管理

缓解措施：

严格的服务器认证
细粒度的权限控制
审计和监控机制

七、技术深度解析

7.1 物理 AI 的技术栈

NVIDIA 三机架构详解

┌─────────────────────────────────────────┐
│         训练阶段（Training）             │
│   NVIDIA DGX AI 超级计算机               │
│   - 大规模数据处理                       │
│   - 模型训练和优化                       │
│   - 迁移学习和微调                       │
└─────────────────┬───────────────────────┘
                  │
                  ↓
┌─────────────────────────────────────────┐
│        模拟阶段（Simulation）            │
│   NVIDIA RTX PRO 服务器                  │
│   + Omniverse（物理仿真平台）            │
│   + Cosmos（机器人仿真）                 │
│   - 虚拟环境测试                         │
│   - 边缘案例模拟                         │
│   - 安全性验证                           │
└─────────────────┬───────────────────────┘
                  │
                  ↓
┌─────────────────────────────────────────┐
│        推理阶段（Inference）             │
│   NVIDIA Jetson AGX Thor                 │
│   - 设备端实时推理                       │
│   - 低延迟决策                           │
│   - 能效优化                             │
└─────────────────────────────────────────┘

设备端 LLM 的技术挑战

挑战	技术方案	代表产品
模型尺寸	蒸馏、剪枝、量化	Gemma 3n、Mu
计算资源	NPU 加速、异构计算	Microsoft Mu (NPU)
延迟要求	本地推理、缓存优化	Mu（>100 token/s）
能耗限制	模型压缩、动态调度	Jetson AGX Thor

7.2 MCP 协议架构

协议层次

┌─────────────────────────────────────────┐
│         应用层（Application）            │
│   ChatGPT / Claude / 编码工具            │
└─────────────────┬───────────────────────┘
                  │
                  ↓
┌─────────────────────────────────────────┐
│      MCP 客户端层（MCP Client）          │
│   - 请求封装                             │
│   - 响应解析                             │
│   - 会话管理                             │
└─────────────────┬───────────────────────┘
                  │
                  ↓ MCP 协议
                  │
┌─────────────────────────────────────────┐
│      MCP 服务端层（MCP Server）          │
│   - 请求路由                             │
│   - 权限验证                             │
│   - 数据转换                             │
└─────────────────┬───────────────────────┘
                  │
                  ↓
┌─────────────────────────────────────────┐
│         数据源层（Data Sources）         │
│   文件系统 / 数据库 / API / 工具         │
└─────────────────────────────────────────┘

MCP vs 传统集成方案

维度	传统方案	MCP 方案
集成复杂度	O(n×m) n个模型 × m个数据源	O(n+m) 统一协议
开发成本	每个集成独立开发	一次开发，处处可用
维护成本	多套代码维护	统一协议维护
扩展性	线性增长	指数级增长
互操作性	低	高

7.3 RAG 技术演进

三代 RAG 技术

第一代：Naive RAG（朴素 RAG）
├─ 向量检索
├─ 简单拼接
└─ 直接生成

第二代：Advanced RAG（高级 RAG）
├─ 混合检索（向量 + 关键词）
├─ 重排序（Reranking）
├─ 查询改写
└─ 上下文压缩

第三代：Modular RAG（模块化 RAG）
├─ 多路召回
├─ 多轮迭代
├─ 自适应检索
└─ 反思与修正

企业级 RAG 架构

用户查询
    ↓
查询理解（Query Understanding）
├─ 意图识别
├─ 实体抽取
└─ 查询扩展
    ↓
多路召回（Multi-Recall）
├─ 向量检索（语义相似）
├─ 关键词检索（精确匹配）
├─ 图检索（关系推理）
└─ SQL 查询（结构化数据）
    ↓
融合与重排序（Fusion & Reranking）
├─ 结果去重
├─ 相关性评分
└─ 多样性优化
    ↓
上下文构建（Context Building）
├─ 信息压缩
├─ 重要性排序
└─ Token 预算管理
    ↓
生成与验证（Generation & Validation）
├─ LLM 生成
├─ 事实核查
└─ 引用标注
    ↓
答案呈现

八、专家团队介绍

Srini Penchikala

职位：高级软件架构师
角色：InfoQ AI/ML/数据工程社区首席编辑
经验：软件架构、设计和开发超过 22 年
著作：

《使用 Apache Spark 进行大数据处理》
《Spring Roo in Action》（合著）

演讲经历：

Big Data Conference
Enterprise Data World
JavaOne
SEI 架构技术大会（SATURN）
No Fluff Just Stuff

Savannah Kunovsky

职位：IDEO 新兴技术董事总经理
专业领域：

AI/ML
扩展现实（XR）
机器人技术
互联网的未来

职业亮点：

与 John Gottman 博士合作开创情感 AI（Emotion AI）
共同创办非洲科技教育连锁学校 Moringa School
软件工程师出身

演讲平台：

SxSW
Fast Company 创新节
麻省理工学院媒体实验室
哈佛大学

认可：麻省理工学院、《福布斯》、世界经济论坛

Anthony Alford

职位：Genesys 高级开发总监
专业领域：客户体验相关的 AI 和 ML 项目
经验：可扩展软件设计和构建超过 20 年
学历：电气工程博士（专攻智能机器人软件）
研究方向：

人机交互
SaaS 业务优化预测分析

Daniel Dominguez

职位：SamXLabs 管理合伙人
经验：为初创公司和财富 500 强企业开发软件产品超过 13 年
学历：

华盛顿大学工程学学位
机器学习专业学位

身份：AWS 社区建设者（机器学习级别）
热情：利用 AI 和云计算打造创新解决方案

Vinod Goje

专业领域：金融领域的 AI 应用
经验：

高频、低延迟固定收益电子交易系统开发
可扩展的云端 AI/ML 平台构建

定位：开源 AI 的支持者
方法论：数据驱动的方法推动金融科技创新

九、相关资源与扩展阅读

InfoQ 相关文章

架构与设计
- "Scaling the BBC Design System: Tooling, Community, Governance and Gardening"
- "Beyond the Hype: Architecting Systems with Agentic AI"
AI/ML 深度
- "Anthropic Reveals Three Infrastructure Bugs behind Claude Performance Issues"
- "Hugging Face Launches mmBERT: 1,800+ Languages Support"
DevOps 实践
- "Microsoft Announces General Availability of AKS Automatic"
- "Pulumi Launches Neo: Agentic AI Platform Engineer"

开源项目

MCP：https://github.com/anthropics/mcp
LangChain4j：Java 的 LLM 应用框架
Playwright：浏览器自动化
Figma MCP：设计稿集成

十、行动建议

对于技术领导者

短期（3-6个月）

评估 AI Agents：在非关键业务中试点
部署 RAG 系统：改善内部知识管理
实施 MCP 标准：统一 AI 工具集成
建立 AI 安全框架：权限、审计、监控

中期（6-12个月）

推广 MLOps：标准化 ML 生产流程
投资物理 AI：探索机器人和设备端应用
优化 HCI：以用户为中心重新设计界面
Vector DB 部署：支持语义搜索和推荐

长期（12-24个月）

多模态战略：整合文本、图像、视频能力
边缘计算布局：隐私保护和低延迟
AI DevOps 全面化：从开发到运维的 AI 赋能
生态系统建设：参与开源，影响标准

对于开发者

技能提升路径

第一阶段：基础能力
├─ 掌握 1-2 个主流 LLM API
├─ 学习 RAG 基础架构
└─ 了解 Prompt Engineering

第二阶段：进阶能力
├─ MCP 协议开发
├─ AI Agent 构建
├─ Vector DB 应用
└─ MLOps 实践

第三阶段：专家能力
├─ 多模态模型应用
├─ 物理 AI / 机器人技术
├─ HCI 设计思维
└─ AI 安全与伦理

实践项目建议

初级项目：基于 OpenAI API 的 RAG 应用
中级项目：MCP 服务器开发（如 Notion、Jira 集成）
高级项目：多智能体协作系统
专家项目：边缘设备的 AI 应用

对于产品经理

产品设计原则

AI 能力评估
- 哪些功能适合 AI？
- AI 的成本效益如何？
- 用户信任度如何建立？
体验设计
- 从显性交互到隐性交互
- 情境感知和个性化
- 错误处理和用户控制
价值度量
- 效率提升指标
- 用户满意度
- ROI 计算

附录：技术对比矩阵

AI 代理平台对比

平台	开发语言	生态系统	生产就绪	成本
Amazon Bedrock Agents	Python, Java	AWS	⭐⭐⭐⭐⭐	按使用付费
Anthropic Claude	API	开放	⭐⭐⭐⭐	按 token 付费
OpenAI Agents	Python	OpenAI	⭐⭐⭐⭐	按使用付费
Strands SDK	多语言	开源	⭐⭐⭐	免费（开源）

向量数据库对比

产品	性能	易用性	扩展性	生态	价格
Pinecone	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	$$
Weaviate	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐	$
Milvus	⭐⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐	Free
Qdrant	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐	Free/$

重要链接

原文地址：https://www.infoq.com/articles/ai-ml-data-engineering-trends-2025/
InfoQ AI/ML 社区：https://www.infoq.com/ai-ml-data-eng/
播客收听：InfoQ Podcast

报告生成时间：2025-10-04
信息来源：InfoQ - AI, ML and Data Engineering Trends Report 2025
版权声明：内容版权归 InfoQ 和 C4Media Inc. 所有
报告作者：AI 辅助整理（基于原文内容）

结语

这份趋势报告为我们描绘了 AI/ML 技术的全景图。从创新者阶段的物理 AI 和 AI Agents，到已经商品化的 RAG 技术，再到成为基础设施的数据湖仓和流处理，技术的演进清晰可见。

关键要点回顾：

物理 AI 是下一个前沿，将 AI 从数字世界带入物理世界
MCP 协议 正在成为 AI 互操作性的事实标准
RAG 已从创新技术变为企业标配
人机交互 需要从技术驱动转向需求驱动
AI 安全 随着能力增强变得越来越重要

对于技术从业者而言，保持对创新者阶段技术的关注，同时深入掌握早期采用者和早期大众阶段的技术，是在 AI 时代保持竞争力的关键。

未来属于那些能够将技术与人类真实需求连接起来的人。

posted @ 2025-12-05 23:47 吾以观复阅读(4) 评论(0) 收藏举报

刷新页面返回顶部

以观复

人神好清，而心扰之；人心好静，而欲牵之。

InfoQ AI、ML与数据工程趋势报告2025——技术采用周期全景分析

InfoQ AI、ML 与数据工程趋势报告 2025——技术采用周期全景分析

执行摘要

核心洞察（Key Takeaways）

技术采用周期全景图

2025 年趋势图变化亮点

一、创新者阶段（Innovators）

1.1 AI Agents（人工智能代理）

重大进展

技术演进

专家观点

实际应用案例

1.2 多模态语言模型（Multimodal LLMs）

核心能力

价值体现

1.3 物理 AI（Physical AI）⭐⭐⭐⭐⭐

定义

重大发布

NVIDIA 物理 AI 完整解决方案

专家洞察

1.4 模型上下文协议（MCP）⭐⭐⭐⭐⭐

基本信息

核心价值

作用机制

行业采用

专家讨论

实际应用

1.5 人机交互（HCI）

核心理念

IDEO 的实践案例

案例 1：商业设计师的创新表达

案例 2：设计流程的转变

Apple Liquid Glass 设计系统

麻省理工学院媒体实验室：流畅界面小组

设计工具的 AI 应用

1.6 其他创新者阶段技术

推理模型（Reasoning Models）

AI DevOps

二、早期采用者阶段（Early Adopters）

2.1 语言模型创新（LLM Innovations）

OpenAI GPT-5

发布策略变化

视觉 LLM（VLM）

小型语言模型（SLM）

其他发展

2.2 检索增强生成（RAG）⭐⭐⭐⭐⭐

技术成熟度

企业采用现状

创新应用：设计流程的变革

传统设计调研流程

RAG 增强的设计流程

2.3 自动化机器学习（AutoML）

三、早期大众阶段（Early Majority）

技术已跨越鸿沟，进入主流应用

3.1 向量数据库（Vector DBs）

3.2 MLOps

3.3 合成数据（Synthetic Data）

四、晚期大众阶段（Late Majority）

技术已完全成熟，成为核心架构模式

4.1 数据湖仓（Lakehouses）

4.2 流处理（Stream Processing）

4.3 分布式计算（Distributed Computation）

五、未来预测（团队展望）

5.1 技术趋势预测

5.2 详细预测分析

预测 1：AI 代理和编码工具

预测 2：实用性驱动

预测 3：视频 RAG

预测 4：AI 泡沫讨论

预测 5：无处不在的 AI

六、关键洞察与启示

6.1 技术选型建议

对于企业决策者

对于技术团队

6.2 人机交互的设计原则

原则 1：以人为中心

原则 2：隐私与信任

原则 3：流畅性与情境感知