麦肯锡2025 AI调研：88%企业都在用AI，为什么只有6%成了赢家？

一组让人睡不着觉的数字

2025年12月，麦肯锡发布最新一期《AI应用现状调研》，覆盖105个国家、1993份问卷。里面有几个数字放在一起看，张力很强：

88% 的企业已经在至少一个职能中常态化使用AI
62% 的企业开始试用Agent（智能体）
但只有 39% 的企业认为AI对EBIT产生了影响，且多数说"贡献率不足5%"
最终被定义为"AI高绩效企业"的，只有 6%

几乎所有企业都上车了，但绝大多数车还停在试点车位上没开出去。

报告里更刺眼的一组分布是：当前企业的AI应用阶段，探索32%、试点30%、规模化31%、全面部署7%——62%的企业还没走出试点。

卡点在哪

这跟我这些年在客户现场反复看到的情况吻合。大量企业的AI项目是这样的形态：IT部门搭了个内部问答助手，营销部门接了个文案生成工具，客服上了个智能机器人——三个项目互不相通，各算各的ROI。每个单点都"成功"，但加起来对公司EBIT几乎没影响。

Agent的情况更说明问题。62%的企业在试，23%声称已在至少一个职能启动规模化应用。但拆到具体职能去看，任何单一职能里"已进入规模化阶段"的受访者比例都不超过10%——IT最高8%，知识管理7%，营销与销售6%。也就是说，即便那些把Agent推到规模化的企业，应用范围也基本局限在一两个职能。

试点很热闹，规模化很冷清——而且冷清得很窄。

那6%做对了什么

麦肯锡把"EBIT被AI拉动超过5%、且明确产生显著价值"的企业定义为AI高绩效企业。把报告里关于这6%的数据拉出来排一下，差距不在技术先进性上，在四个战略选择上。

选择1：不把AI只当降本工具

80%的企业把AI目标设为"效率提升"。但高绩效企业在增长目标上的设定比例是82%，其他企业只有50%；创新目标上是79% vs 50%。

差距不在效率，而在增长和创新——高绩效企业三个目标都设了，其他企业基本只盯着省钱。

只盯降本的项目，天花板就是当前流程的成本结构。而瞄准增长和创新的项目，天花板是新业务、新客群、新产品。报告里AI带来营收提升最显著的三个职能——营销与销售（67%受访者报告营收提升）、战略与公司财务（65%）、产品/服务开发（62%）——全是增长侧职能，不是降本侧。

选择2：把工作流推倒重来

报告里有一个数字很关键："从根本上重塑工作流"的企业比例，高绩效55%、其他20%，差距2.8倍。麦肯锡通过31项变量做相对权重分析，这是排第一的关键因子。

什么叫"重塑工作流"？区别在于：是"在旧流程里塞一个AI节点"，还是"为AI重新设计整条流程"。

举个抽象例子。客服流程原来是"客户来电→客服记录→查询知识库→回复→工单流转"。第一种做法是把"查询知识库"换成RAG问答，其他步骤不动。第二种做法是重新问：如果Agent能全程在线，意图识别、知识检索、工单预填可以同时完成，那客服这个角色应该做什么？

这两种做法的技术栈可能差不多，但对组织、岗位、KPI、客户体验的影响完全不在一个量级。

选择3：高层真的在用

"强烈认同企业高层对AI举措展现出真正主导权"的比例：高绩效48%，其他16%，差距3倍。

注意"真正"两个字。报告强调，高管不仅是推动者，更是率先践行者。这一条我有切身体会。凡是CEO自己每天用大模型工具的客户，项目落地速度都明显快。凡是CEO只在汇报会上说"AI很重要"但自己从不打开的，项目基本都会卡在中层。

原因不复杂：AI带来的工作流变化是反直觉的，需要打破很多组织惯性。如果高层自己没用过，他根本不知道该破什么、该立什么。

选择4：钱真的投了

把20%以上数字预算投向AI的企业：高绩效35%，其他7%，差距5倍。

这是前三条的必然结果。如果你真的把AI当增长引擎、真的在重构工作流、高层真的在推，那预算结构必然会变。反过来说，预算结构不变，前面三条都是嘴上说说。

技术侧能做什么

报告反复强调"重塑工作流"是高绩效的第一关键因子。从技术架构上看，这意味着Agent的核心价值不是"会聊天"，而是把原本被人串起来的多步骤工作，重新组织成机器可以编排的流程。

我们团队在做企业级Agent编排层时，反复验证过一个朴素的设计原则：步骤可编排、过程可审计、关键节点必须人工核验。写一段极简代码示意这个思路：

python

from dataclasses import dataclass
from typing import Callable

@dataclass
class WorkflowStep:
    name: str
    handler: Callable
    requires_human_review: bool = False

class AgentWorkflow:
    def __init__(self, steps: list[WorkflowStep]):
        self.steps = steps
        self.audit_log = []

    def run(self, input_data):
        context = {"input": input_data}
        for step in self.steps:
            output = step.handler(context)
            if step.requires_human_review:
                output = self._hitl(step.name, output)
            context[step.name] = output
            self.audit_log.append({
                "step": step.name,
                "preview": str(output)[:100]
            })
        return context

    def _hitl(self, step_name, output):
        # 关键节点强制人工核验,实际项目中触发审批流
        print(f"[HITL] {step_name} 等待人工核验...")
        return output

代码本身很简单，但有三个点对应报告的发现：

步骤可编排：把原本串接在不同人之间的工作，变成机器编排——这就是"重塑工作流"
可审计日志：每一步都被记录——对应高绩效企业重点投入的"治理"实践
人在环路（HITL）：关键步骤强制人工核验——报告里这一项的采用率高绩效65% vs 其他23%，差距近3倍

很多Agent项目失败的根因，是把这三件事的任意一个砍了：要么没编排（只是LLM调用堆叠）、要么没日志（出问题查不出原因）、要么没HITL（一旦出错没人兜底）。

这也是我们在Bizfocus ADP上做架构选型时的核心判断：把数据层（湖仓一体）、知识层（RAG）、智能体编排层做成三套解耦的组件，业务域之间可以独立迭代各自的工作流，不必每个域都从零搭底层——这跟报告里"高绩效企业在多个职能并行规模化"的发现是一致的。

最后

报告里6%的高绩效企业分布并不均匀——营收50亿美元以上的企业进入规模化阶段的比例是49%，营收1亿美元以下的只有29%。

但被识别为高绩效特征的那十几条实践——人机协同、清晰路线图、领导层共识、迭代式开发、工作流重塑——没有一条是只有大企业才做得到的。中型企业往往比大企业更容易做这些事，因为决策链短、流程包袱小、CEO能直接拍板。

最重要的发现"高绩效企业把AI视为增长、创新与降本的引擎，而非只盯着降本"，本质上是一个战略选择问题，不是预算问题。

战略选择有时候比技术选型重要得多。

Agent的真正规模化还没开始。现在入场，不算晚。

参考资料：麦肯锡QuantumBlack《2025麦肯锡AI应用现状调研：智能体创新和转型》，2025年12月。

posted @ 2026-05-12 16:30 阿瑞说项目管理阅读(98) 评论(0) 收藏举报

刷新页面返回顶部