麦肯锡2025 AI调研:88%企业都在用AI,为什么只有6%成了赢家?

一组让人睡不着觉的数字

2025年12月,麦肯锡发布最新一期《AI应用现状调研》,覆盖105个国家、1993份问卷。里面有几个数字放在一起看,张力很强:

  • 88% 的企业已经在至少一个职能中常态化使用AI

  • 62% 的企业开始试用Agent(智能体)

  • 但只有 39% 的企业认为AI对EBIT产生了影响,且多数说"贡献率不足5%"

  • 最终被定义为"AI高绩效企业"的,只有 6%

几乎所有企业都上车了,但绝大多数车还停在试点车位上没开出去。

报告里更刺眼的一组分布是:当前企业的AI应用阶段,探索32%、试点30%、规模化31%、全面部署7%——62%的企业还没走出试点

卡点在哪

这跟我这些年在客户现场反复看到的情况吻合。大量企业的AI项目是这样的形态:IT部门搭了个内部问答助手,营销部门接了个文案生成工具,客服上了个智能机器人——三个项目互不相通,各算各的ROI。每个单点都"成功",但加起来对公司EBIT几乎没影响。

Agent的情况更说明问题。62%的企业在试,23%声称已在至少一个职能启动规模化应用。但拆到具体职能去看,任何单一职能里"已进入规模化阶段"的受访者比例都不超过10%——IT最高8%,知识管理7%,营销与销售6%。也就是说,即便那些把Agent推到规模化的企业,应用范围也基本局限在一两个职能。

试点很热闹,规模化很冷清——而且冷清得很

那6%做对了什么

麦肯锡把"EBIT被AI拉动超过5%、且明确产生显著价值"的企业定义为AI高绩效企业。把报告里关于这6%的数据拉出来排一下,差距不在技术先进性上,在四个战略选择上。

选择1:不把AI只当降本工具

80%的企业把AI目标设为"效率提升"。但高绩效企业在增长目标上的设定比例是82%,其他企业只有50%;创新目标上是79% vs 50%。

差距不在效率,而在增长和创新——高绩效企业三个目标都设了,其他企业基本只盯着省钱。

只盯降本的项目,天花板就是当前流程的成本结构。而瞄准增长和创新的项目,天花板是新业务、新客群、新产品。报告里AI带来营收提升最显著的三个职能——营销与销售(67%受访者报告营收提升)、战略与公司财务(65%)、产品/服务开发(62%)——全是增长侧职能,不是降本侧。

选择2:把工作流推倒重来

报告里有一个数字很关键:"从根本上重塑工作流"的企业比例,高绩效55%、其他20%,差距2.8倍。麦肯锡通过31项变量做相对权重分析,这是排第一的关键因子。

什么叫"重塑工作流"?区别在于:是"在旧流程里塞一个AI节点",还是"为AI重新设计整条流程"。

举个抽象例子。客服流程原来是"客户来电→客服记录→查询知识库→回复→工单流转"。第一种做法是把"查询知识库"换成RAG问答,其他步骤不动。第二种做法是重新问:如果Agent能全程在线,意图识别、知识检索、工单预填可以同时完成,那客服这个角色应该做什么?

这两种做法的技术栈可能差不多,但对组织、岗位、KPI、客户体验的影响完全不在一个量级。

选择3:高层真的在用

"强烈认同企业高层对AI举措展现出真正主导权"的比例:高绩效48%,其他16%,差距3倍。

注意"真正"两个字。报告强调,高管不仅是推动者,更是率先践行者。这一条我有切身体会。凡是CEO自己每天用大模型工具的客户,项目落地速度都明显快。凡是CEO只在汇报会上说"AI很重要"但自己从不打开的,项目基本都会卡在中层。

原因不复杂:AI带来的工作流变化是反直觉的,需要打破很多组织惯性。如果高层自己没用过,他根本不知道该破什么、该立什么。

选择4:钱真的投了

把20%以上数字预算投向AI的企业:高绩效35%,其他7%,差距5倍。

这是前三条的必然结果。如果你真的把AI当增长引擎、真的在重构工作流、高层真的在推,那预算结构必然会变。反过来说,预算结构不变,前面三条都是嘴上说说。

203.jpeg

技术侧能做什么

报告反复强调"重塑工作流"是高绩效的第一关键因子。从技术架构上看,这意味着Agent的核心价值不是"会聊天",而是把原本被人串起来的多步骤工作,重新组织成机器可以编排的流程

我们团队在做企业级Agent编排层时,反复验证过一个朴素的设计原则:步骤可编排、过程可审计、关键节点必须人工核验。写一段极简代码示意这个思路:

python

from dataclasses import dataclass
from typing import Callable

@dataclass
class WorkflowStep:
    name: str
    handler: Callable
    requires_human_review: bool = False

class AgentWorkflow:
    def __init__(self, steps: list[WorkflowStep]):
        self.steps = steps
        self.audit_log = []

    def run(self, input_data):
        context = {"input": input_data}
        for step in self.steps:
            output = step.handler(context)
            if step.requires_human_review:
                output = self._hitl(step.name, output)
            context[step.name] = output
            self.audit_log.append({
                "step": step.name,
                "preview": str(output)[:100]
            })
        return context

    def _hitl(self, step_name, output):
        # 关键节点强制人工核验,实际项目中触发审批流
        print(f"[HITL] {step_name} 等待人工核验...")
        return output

代码本身很简单,但有三个点对应报告的发现:

  1. 步骤可编排:把原本串接在不同人之间的工作,变成机器编排——这就是"重塑工作流"

  2. 可审计日志:每一步都被记录——对应高绩效企业重点投入的"治理"实践

  3. 人在环路(HITL):关键步骤强制人工核验——报告里这一项的采用率高绩效65% vs 其他23%,差距近3倍

很多Agent项目失败的根因,是把这三件事的任意一个砍了:要么没编排(只是LLM调用堆叠)、要么没日志(出问题查不出原因)、要么没HITL(一旦出错没人兜底)。

这也是我们在Bizfocus ADP上做架构选型时的核心判断:把数据层(湖仓一体)、知识层(RAG)、智能体编排层做成三套解耦的组件,业务域之间可以独立迭代各自的工作流,不必每个域都从零搭底层——这跟报告里"高绩效企业在多个职能并行规模化"的发现是一致的。

摄图网_604461743_医生穿白服坐办公桌前使用电脑办公(企业商用).jpeg

最后

报告里6%的高绩效企业分布并不均匀——营收50亿美元以上的企业进入规模化阶段的比例是49%,营收1亿美元以下的只有29%。

但被识别为高绩效特征的那十几条实践——人机协同、清晰路线图、领导层共识、迭代式开发、工作流重塑——没有一条是只有大企业才做得到的。中型企业往往比大企业更容易做这些事,因为决策链短、流程包袱小、CEO能直接拍板。

最重要的发现"高绩效企业把AI视为增长、创新与降本的引擎,而非只盯着降本",本质上是一个战略选择问题,不是预算问题。

战略选择有时候比技术选型重要得多。

Agent的真正规模化还没开始。现在入场,不算晚。


参考资料:麦肯锡QuantumBlack《2025麦肯锡AI应用现状调研:智能体 创新和转型》,2025年12月。

posted @ 2026-05-12 16:30  阿瑞说项目管理  阅读(9)  评论(0)    收藏  举报