有一类需求,数据团队听到之后会本能地紧张。
领导在会上说:“今年公司要重视数据资产,你们先把数据资产盘一下。”
这句话听起来不复杂。甚至很像一个标准数据治理动作:拉表清单,补字段说明,填负责人,做一个目录。
但做过的人都知道,如果第一步就从“盘表”开始,这件事很容易走偏。
最后你会得到一个很大的 Excel:几千张表,几十个字段,若干责任人,一堆“待确认”。表格越填越厚,业务越看越困,领导问“这些资产到底有什么用”时,会议室会短暂安静。
数据资产不是表名清单。
一张表能不能叫资产,不取决于它有没有被登记,而取决于它能不能在某个真实场景里被持续使用,有没有人负责,质量是否可信,出了问题能不能追得回,能不能给业务、AI 或管理动作带来结果。
所以公司开始提“数据资产”时,数据团队第一件事不是盘全量表,而是先找真实场景。
先把“资产”从口号里拿出来
“资产”这个词很容易让人误会。
一旦叫资产,大家就会想到盘点、估值、入表、目录、权属、责任人。于是项目还没开始,就已经变成一个庞大的管理动作。
管理动作不是不重要,但如果没有使用场景托底,它会变得很空。
我更愿意把数据资产先理解成一句朴素的话:
一份能被反复使用、能解决具体问题、有人维护、可以被信任的数据供给。
这句话里有四个关键词。
第一,反复使用。一次性临时取数不一定是资产,但如果同类需求反复出现,就有资产化的可能。
第二,具体问题。没有问题的数据只是存量,不是资产。
第三,有人维护。没人负责的数据,迟早会变成没人敢用的数据。
第四,可以信任。质量、口径、权限、血缘不清楚,再有价值也很难规模化使用。
所以不要一上来问“我们有多少张表”。
先问:公司现在有哪些问题,值得用数据长期解决?
第一步:从三个场景池里找资产候选
数据资产盘点最怕全量铺开。
全量铺开的好处是看起来完整,坏处是很快没人关心。因为大多数表在当前阶段并不值得被当成资产管理。它们可能只是中间过程、历史包袱、一次性任务、废弃模型,或者没人再用的实验残留。
更好的做法,是先建立三个场景池。
1. 高频决策场景
这是最容易产生价值的地方。
比如经营会、销售复盘、渠道投放、库存预警、客户分层、履约监控、风控审核、活动复盘。只要某个场景每周、每天甚至每小时都在使用数据,它背后的核心表、核心指标、核心维度就值得优先盘。
判断标准很简单:这个数据如果错了,会不会影响会议判断?如果晚了,会不会影响当天动作?如果没人维护,业务会不会回到 Excel?
答案是“会”的,就进入候选池。
2. AI 与自动化场景
第二类是 AI 场景。
比如 AI 问数、智能客服、知识库问答、异常归因、自动报告、行业模型训练。这类场景对数据资产的要求更高,因为 AI 会把数据问题放大。
过去一个字段解释不清,可能只是分析师多问一句。现在如果模型直接拿它生成答案,错误会传播得更快。
所以凡是要被 AI 调用的数据,都要优先检查:来源、口径、权限、更新、质量、责任人。
3. 外部申报与合规场景
第三类是外部场景。
比如数据要素项目、行业试点、审计、合规检查、数据资产入表、对外合作。它们不一定每天发生,但一旦发生,就会要求你证明数据可控、可用、可追溯。
这类场景需要的不是“我们有很多数据”,而是“这份数据从哪里来,怎么治理,谁负责,用出了什么效果”。
如果公司近期正在做这类事情,相关数据也应优先进入资产候选池。

第二步:用四个问题筛掉低价值资产
有了候选池之后,不要急着登记。
先筛。
很多数据看起来重要,但短期内并不值得资产化。数据团队的精力有限,如果把所有东西都纳入管理,最后一定管不过来。
我建议用四个问题筛选。
1. 有没有明确使用者?
一份数据如果没人说得清谁会用,通常不该优先做资产。
“以后可能会用”不是使用者。
真正的使用者应该是某个角色、某个团队、某个流程。比如销售主管每周看客户转化,风控团队每天用企业风险标签,运营同学复盘活动效果,AI 问数系统要回答经营指标。
使用者越具体,资产价值越容易成立。
2. 是否解决稳定问题?
如果问题只出现一次,临时处理即可。
如果问题反复出现,就值得沉淀。
比如业务每周都问同一批指标,说明这里可能需要指标资产。每次活动都要重新拉人群包,说明这里可能需要人群资产。每次模型训练都要重新整理样本,说明这里可能需要数据集资产。
资产化的本质,是把重复问题变成稳定供给。
3. 是否有人愿意负责?
没人负责的数据,最好先不要包装成资产。
责任不是写一个名字那么简单。真正的责任包括:口径解释、数据质量、变更通知、权限审批、问题响应。
如果业务说这份数据很重要,但不愿意确认口径;技术说可以维护,但不知道谁使用;管理层说要资产,但不给资源,这些都是风险信号。
4. 是否能形成可见结果?
数据资产不能只停留在目录里。
它至少应该形成一种可见结果:减少重复取数,支撑一个核心看板,进入一个 AI 应用,降低一个风险,提升一个流程效率,或者成为一个项目申报材料里的核心证据。
如果完全说不出结果,优先级就要往后放。
第三步:为每个资产写一张“资产卡”
筛完之后,再登记。
但不要只登记表名、库名、字段名。那只是技术目录。
面向公司内部协作,我建议每个数据资产至少写一张“资产卡”。
可以先用下面这个结构:
| 字段 | 要回答的问题 |
|---|---|
| 资产名称 | 这份数据用业务语言叫什么? |
| 服务场景 | 它解决哪个稳定问题? |
| 使用者 | 谁会反复使用它? |
| 数据来源 | 原始数据来自哪些系统? |
| 核心口径 | 最容易误解的定义是什么? |
| 质量要求 | 延迟、完整性、准确性要求是什么? |
| 权限边界 | 谁能看,谁能导出,能否给 AI 调用? |
| 责任人 | 业务口径、技术链路、质量响应分别是谁? |
| 下游应用 | 支撑哪些看板、报表、模型或流程? |
| 最近更新 | 最近一次口径或结构变化是什么? |
这张卡的价值,不是为了好看。
它是让数据资产从“技术对象”变成“协作对象”。
业务看得懂它解决什么问题。数据开发知道它怎么维护。治理负责人知道它有什么风险。管理层能看到它和业务动作之间的关系。

第四步:责任要分层,不要只写一个人
很多资产目录里都会有一个“负责人”字段。
这个字段很危险。
因为一旦只写一个人,所有问题都会被塞给他。口径错了找他,任务失败找他,权限审批找他,下游投诉也找他。最后这个负责人要么变成背锅人,要么变成摆设。
数据资产的责任应该分层。
至少分四类。
业务口径负责人
负责确认这份数据在业务上是什么意思。
比如“有效客户”“活跃设备”“成交金额”“风险等级”,这些定义不能只由数据开发猜。业务口径负责人要能回答:统计范围是什么,排除条件是什么,什么时候需要变更。
技术链路负责人
负责数据加工、调度、模型、字段变更、链路稳定性。
这通常是数据开发或数仓同学。
质量响应负责人
负责质量异常后的响应和复盘。
这个角色不一定是单独的人,但必须明确机制。比如核心资产延迟超过 30 分钟,谁通知业务,谁判断影响,谁负责补数。
权限与合规负责人
负责判断谁能用、怎么用、能不能导出、能不能给模型调用。
如果涉及个人信息、敏感数据、外部合作或 AI 应用,这个角色尤其重要。

把责任分层以后,数据资产才不容易变成“登记一个名字,出了事全找他”。
第五步:把资产维护放进流程
数据资产不是盘完就结束。
它更像一个小产品。只要有人用,就会有变更、问题、反馈和迭代。
所以每个核心资产至少需要三个流程。
1. 变更流程
字段新增、字段废弃、口径调整、来源系统变化,都要记录。
不是所有变化都需要开大会,但核心资产的变化不能悄悄发生。
至少要有变更说明、影响范围、上线时间和通知对象。
2. 质量流程
核心资产要有质量规则。
比如更新延迟、行数波动、空值率、唯一性、枚举值、金额范围、核心字段异常。
但更重要的是响应机制:告警发给谁,多久响应,影响哪些下游,修复后是否复盘。
3. 使用反馈流程
资产有没有被用,怎么被用,用得好不好,也要有人看。
如果一份数据资产登记后半年没人用,它可能不是资产,只是库存。
如果使用频率很高,但问题也很多,就说明它需要治理资源。
资产价值不是写在目录里的,是在使用中被验证的。
一个可执行的 7 天起步法
如果公司刚开始提数据资产,我不建议你一上来做三个月大项目。
可以先用 7 天做一个小闭环。
第 1 天:选一个高频场景
不要全公司铺开。
选一个真实场景,比如经营会核心指标、销售跟进、活动复盘、AI 问数首批问题、客户分层。
第 2 天:列出相关数据候选
只列这个场景相关的表、指标、字段、看板、临时取数脚本。
先不追求完整。
第 3 天:找使用者确认问题
问业务三个问题:你们什么时候用?用来做什么决定?现在最不放心哪里?
这一步很关键。很多数据资产项目失败,就是因为没有问真实使用者。
第 4 天:写资产卡初版
按前面的结构写一张资产卡。
只写最核心的 3–5 个资产,不要贪多。
第 5 天:确认责任分层
和业务、数据开发、治理或安全相关同学确认:口径谁负责,链路谁负责,质量谁响应,权限谁审批。
第 6 天:补一条质量规则和一条变更规则
不要先做复杂平台。
先给核心资产补最重要的一条质量规则,再补一条变更通知规则。
第 7 天:向领导交付一个小样板
交付物不是“我们盘了多少表”。
而是:我们围绕一个场景,识别了哪些核心数据资产,明确了哪些责任,发现了哪些风险,下一步可以怎么扩展。
这个样板比一份巨大目录更有说服力。
什么时候才需要全量盘点?
不是说全量盘点永远不要做。
当公司已经有清楚的治理目标、组织责任、数据目录工具、核心场景清单和维护机制时,全量盘点是有价值的。
但在早期,直接全量盘点通常会遇到三个问题。
第一,成本很高。大量表没人用,解释它们会消耗很多时间。
第二,质量很差。字段说明靠猜,责任人靠问,台账很快过期。
第三,价值不明显。领导看到的是数量,业务看到的是负担,数据团队看到的是无尽维护。
所以顺序很重要。
先从场景资产化,做出样板,再扩展到更多场景,最后再沉淀目录和制度。
不要反过来。
数据资产项目最该避免的三种结局
第一种结局,是“目录很好看,没人使用”。
这说明项目只完成了登记,没有进入业务流程。
第二种结局,是“责任写满了,没人负责”。
这说明责任只是字段,不是机制。
第三种结局,是“盘点很热闹,半年后没人更新”。
这说明资产没有和真实使用、变更、质量、反馈绑定。
数据团队要尽量避免这三种结局。
如果你正在接一个数据资产项目,可以记住一句话:
先证明一份数据为什么值得被当成资产,再把它登记进资产目录。
这句话能帮你挡住很多无效工作。
公司开始提“数据资产”,未必是坏事。相反,它可能是数据团队重新定义自己价值的机会。
但前提是,我们不要把这件事做成一场填表运动。
从一个真实场景开始,找到反复使用的数据,明确责任,补上质量和权限边界,再把它做成一个小样板。
这样做不花哨,但有用。
数据资产不是被盘出来的。
它是被使用、被维护、被信任,最后才被组织承认的。

如果你想系统学习数据资产、数据治理、指标体系和 AI 数据供给,可以继续看数据从业者全栈知识库。这类能力不是会填一张表就够了,而是要能在公司内部把场景、数据、责任和结果串起来。
我叫石头,在数据行业里摸爬滚打了十几年,见过太多数据治理项目从雄心勃勃开始,最后停在一张没人更新的表里。这里写的,就是这些教训——我觉得值得说出来的那部分。
参考资料
- 国家数据局:《刘烈宏出席数据安全发展大会开幕式并启动2026年“数据要素×”大赛》 https://www.nda.gov.cn/sjj/jgsz/jld/llh/llhldhd/0523/20260523220615539632976_pc.html
- 国家数据局:《全国数据资源调查报告(2025年)》正式发布 https://www.nda.gov.cn/sjj/ywpd/sjzy/0429/20260429164803571173880_pc.html
浙公网安备 33010602011771号