2025-年秋季的-10-个数据-AI-观察点

2025 年秋季的 10 个数据+AI 观察点

原文:towardsdatascience.com/10-data-ai-observations-to-watch-in-fall-2025/

随着我们接近 2025 年的最后一个季度,是时候退后一步,审视将塑造 2026 年数据和 AI 的趋势。

尽管标题可能关注最新的模型发布和基准战争,但这些远非地面上的最具有变革性的发展。真正的变化正在前线发生——数据科学家、数据+AI 工程师和 AI/ML 团队正在激活这些复杂系统和技术以投入生产。不出所料,向生产 AI 的推动——以及随之而来的 2025 年的逆风——正在掌舵。

这里是定义这一演变的十个趋势,以及它们在 2025 年最后一个季度即将到来的意义。

1. “数据+AI 领导者”正在崛起

如果你最近在 LinkedIn 上有所活动,你可能已经注意到新闻源中数据+AI 相关标题的数量可疑地增加了——甚至包括你自己的团队成员。

不,没有你不知道的结构重组。

尽管这种变化在很大程度上是那些传统上被归类为数据或 AI/ML 专业人士的自愿改变,但这种标题上的转变反映了蒙特卡洛几乎已经讨论了一年多的现实——数据和 AI 不再是两个独立的学科。

从它们所需资源和技能到它们解决的问题,数据和 AI 是硬币的两面。这种现实正在对 2025 年(你很快就会看到)团队和技术的发展产生可观察的影响。

2. 对话式 BI 很热门——但它需要温度检查

数据民主化已经以某种形式流行了近十年,而对话式 BI 是这一故事中的最新篇章。

对话式 BI 与其他 BI 工具的区别在于它承诺以多快和优雅的方式实现乌托邦愿景——即使是技术最不熟练的领域用户。

前提很简单:如果你能要求它,你就能访问它。这对所有所有者和用户来说都是双赢……在理论上。挑战(就像所有民主化努力一样)不是工具本身——而是你正在民主化的东西的可靠性。

比快速得到糟糕的见解更糟糕的是,快速得到糟糕的见解。将聊天界面连接到一个未受管理的数据库,你不仅会加速访问,还会加速后果。

3. 上下文工程正成为一门核心学科

AI 模型的输入成本大约是输出的 300-400 倍。如果你的上下文数据被诸如不完整元数据、未去除 HTML 或空向量数组等问题所束缚,你的团队在处理大规模时将面临巨大的成本超支。更重要的是,混乱或不完整的上下文也是一个主要的AI 可靠性问题,模糊的产品名称和糟糕的块划分会混淆检索器,而提示或模型的小幅变化可能导致截然不同的输出。

这也就难怪上下文工程在 2025 年中期成为了数据+AI 团队中最热门的词汇。上下文工程是为 AI 模型准备、优化和维护上下文数据的系统过程。那些掌握上游上下文监控——在它们进入昂贵的处理工作之前确保可靠的语料库和嵌入——的团队将看到他们 AI 模型更好的结果。但这不会在孤岛中起作用。

事实是,仅对上下文数据的可见性无法解决 AI 质量问题——像AI 可观察性解决方案这样的评估也无法解决。团队需要一个全面的方法,提供对生产中整个系统的可见性——从上下文数据到模型及其输出的全面系统。将数据+AI结合在一起的社会-技术方法是实现大规模可靠 AI 的唯一途径。

4. AI 热情差距扩大

最新的麻省理工学院报告已经说得很清楚。AI 存在价值问题。至少部分责任在于高管团队。

“我们仍然有很多认为 AI 是魔法,可以无任何思考地做任何你想让它做的事情的人。”

这确实是一句名言,它反映了数据+AI 团队的常见故事

  • 不理解技术的管理者设定了优先级

  • 项目未能提供价值

  • 试点项目被取消

  • 重复上述过程

公司在 AI 试点项目上投入了数十亿美元,但对 AI 将如何产生影响以及如何产生影响没有明确的理解——这不仅在试点性能上产生了明显的影响,而且对整个 AI 热情也产生了影响。

获取价值需要成为首要、第二和第三优先级。这意味着赋予理解技术和将要推动其发展的数据的+AI 团队以自主权,以解决真实业务问题,并拥有使这些用例可靠性的资源。

5. 解密代理与代理工作流程

虽然在过去 18 个月中,代理的愿望一直在推动炒作机器,但“代理 AI”与“代理”之间的语义辩论终于在 LinkedIn 的评论区这个神圣的领域上在今年夏天举行。

问题的核心是这两种看似相同但出人意料地不同的策略在性能和成本上的实质性差异。

  • 单一用途的代理是针对具体、定义明确的任务的工作马,在这些任务中,范围是明确的,结果是可预测的。将它们用于专注的、重复性的工作。

  • 代理工作流程通过将复杂的多步骤过程分解为可管理的组件来处理混乱的过程。关键是把大问题分解成小模型可以处理的离散任务,然后使用更大的模型来验证和汇总结果。

图像:蒙特卡洛的可观察性代理

例如,蒙特卡洛的故障排除代理使用代理工作流程来编排数百个子代理,以调查数据+AI 质量问题的根本原因。

6. 嵌入质量受到关注——监控紧随其后

与旧的数据产品不同,各种形式的 AI 在本质上不是确定性的。输入的并不总是输出的。因此,在这个背景下,揭示什么是好的意味着不仅要衡量输出,还要衡量提供这些输出的系统、代码和输入。

嵌入系统就是这样一种系统。

当嵌入无法表示源数据的语义意义时,无论向量数据库或模型性能如何,AI 都将收到错误的环境。这正是为什么嵌入质量在 2025 年成为一项至关重要的优先任务。

最常见的嵌入中断是基本的数据问题:空数组、错误的维度、损坏的向量值等。问题是大多数团队只有在响应明显不准确时才会发现这些问题。

一位蒙特卡洛的客户完美地捕捉到了这个问题:“我们对嵌入生成的方式、新数据的性质以及它如何影响训练过程没有任何洞察。我们害怕切换嵌入模型,因为我们不知道重新训练会如何影响它。我们是否需要重新训练使用这些内容的模型?我们是否需要从头开始?”

随着质量和性能的关键维度变得清晰,团队开始定义新的监控策略,以支持生产中的嵌入;包括维度、一致性、向量完整性等因素。

7. 向量数据库需要现实检查

向量数据库对 2025 年来说并不新鲜。真正新鲜的是,数据+AI 团队开始意识到他们一直依赖的向量数据库可能并不像他们想象的那么可靠。

在过去 24 个月中,向量数据库(将数据存储为捕获语义意义的高维向量)已成为 RAG 应用的既定基础设施。而在最近几个月,它们也成为数据+AI 团队的烦恼之源。

嵌入式模型会漂移。分块策略会改变。嵌入模型会更新。所有这些变化都会造成无声的性能下降,这通常被误诊为幻觉——并导致团队陷入昂贵的兔子洞去解决这些问题。

挑战在于,与内置监控的传统数据库不同,大多数团队缺乏对向量搜索、嵌入和代理行为的必要可见性,无法在影响之前捕捉到向量问题。这可能导致向量数据库监控实施的增加,以及其他可观察性解决方案,以提高响应准确性。

8. 领先的模型架构优先考虑简单性而不是性能

AI 模型托管领域正在围绕两个明显的赢家——Databricks 和 AWS Bedrock——进行整合。这两个平台通过将 AI 能力直接嵌入到现有的数据基础设施中而不是要求团队学习全新的系统而取得成功。

Databricks 通过模型训练、部署和数据处理的紧密集成而获胜。团队可以在他们的数据所在的平台上进行模型微调,从而消除在系统之间移动数据的复杂性。同时,AWS Bedrock 通过广度和企业级安全性而成功,提供从 Anthropic、Meta 和其他公司的基础模型访问,同时保持严格的数据治理和合规标准。

什么原因导致其他人落后?碎片化和复杂性。需要大量定制集成工作或强迫团队采用全新工具链的平台正在输给那些能够融入现有工作流程的解决方案。

团队正在根据操作简单性和数据集成能力来选择 AI 平台,而不是原始模型性能。赢家明白,如果模型部署和维护过于复杂,那么最好的模型也是无用的。

9. 模型上下文协议(MCP)是最低可接受产品

模型上下文协议(MCP)已成为颠覆性的“AI 的 USB-C”——一个通用标准,允许 AI 应用无需定制集成即可连接到任何数据源。

而不是为每个数据库、CRM 或 API 构建单独的连接器,团队可以使用一个协议同时让 LLMs 访问所有内容。当模型可以从多个数据源无缝提取时,它们可以提供更快、更准确的响应。

早期采用者已经报告说,通过专注于一个在其整个数据生态系统中工作的单一 MCP 实现,已经大幅减少了集成复杂性和维护工作。

作为额外的好处,MCP 还标准化了治理和日志记录——这对于企业部署来说是很重要的要求。

但不要期待 MCP 保持静态。许多数据和 AI 领导者预计在明年内将出现代理上下文协议(ACP),处理更加复杂的上下文共享场景。现在采用 MCP 的团队将准备好随着标准的演变而迎接这些进步。

10. 非结构化数据是新的黄金(但它是愚人的金子吗?)

大多数人工智能应用都依赖于非结构化数据——例如电子邮件、文档、图像、音频文件和支持票证——以提供使人工智能响应有用的丰富上下文。

但尽管团队可以使用成熟的工具监控结构化数据,非结构化数据长期以来一直处于盲点。传统的数据质量监控无法像跟踪数据库表那样处理文本文件、图像或文档。

类似于 Monte Carlo 的非结构化数据监控解决方案通过将自动质量检查引入 Snowflake、Databricks 和 BigQuery 中的文本和图像字段,为用户填补了这一差距。

展望未来,非结构化数据监控将像传统的数据质量检查一样成为标准。组织将实施全面的质量框架,将所有数据——结构化和非结构化——视为关键资产,需要积极的监控和管理。

图片

图片:Monte Carlo

展望 2026 年

如果说 2025 年教会了我们什么,那就是在人工智能领域取得胜利的团队并非拥有最大预算或最炫演示的团队。赢得人工智能竞赛的团队是那些已经找到如何在生产中提供可靠、可扩展和值得信赖的人工智能的团队。

胜利并非在测试环境中造就。它们是在真实用户的手中形成的。提供可采纳的人工智能解决方案,你将提供可证明的人工智能价值。就这么简单。

posted @ 2026-03-27 09:45  绝不原创的飞龙  阅读(0)  评论(0)    收藏  举报