人工智能的未来:2025年值得关注的7大趋势

图片由DALL-E 3生成
可以说,2024年是我们最期待新AI发布和公告的一年。
尽管过程中有一些失望和意外,但总体来看,AI的发展给我们留下了积极的印象。我之所以这样说,是因为我们中的许多人已经越来越多地将各种模型融入日常生活中。
当然,我们总是希望能得到更多——这就是人性。基于这一点,让我们来探讨一些我确信大型科技公司已经在努力解决的挑战和趋势。
需要澄清的是:我并不是试图预测未来——这完全不是我的目标。相反,我想指出一些领域,您可能和我一样注意到,AI还有成长空间。
- 一切围绕AI代理展开
最近几个月,人们越来越渴望更好地了解这项技术。但在深入探讨之前,让我们先回答一个简单的问题:什么是AI代理?
这些是能够推理、计划和采取行动的智能系统。本质上,AI代理可以分解复杂问题、制定多步计划,并与工具和数据库交互以实现特定目标。因此,大多数人都认同高效的AI代理的价值。
然而,挑战在于目前的模型通常难以逻辑和一致地推理。它们通常擅长执行简单计划,但在应对包含多个变量的复杂场景时往往会失去焦点,并做出不完全正确的决定。
AI代理有望根据我们提供的上下文或输入,提供更具体和个性化的响应。最大的障碍之一是如何在代理的自主性和响应质量之间找到平衡。
为了弥合这一差距,我们需要更先进的模型,而2025年将是关键时期。
- 重新思考人类参与的AI系统
您可能听说过一个研究:聊天机器人在临床推理中胜过医生。在这个研究中,50名医生根据病例报告诊断病情。同样的信息也提供给了一个聊天机器人,结果显示,聊天机器人的得分比医生更高。
更有趣的是,部分医生被随机分配到使用聊天机器人作为助手的组中。令人惊讶的是,这组医生的得分比单独工作的聊天机器人还低。这表明AI系统和人类协作过程都存在问题。理想情况下,专家与有效的AI系统结合,应该能比二者单独发挥得更好。
部署由大型语言模型驱动的聊天机器人并非易事。它需要设计正确的提示,这意味着您需要以恰当的方式提问。为了应对这一挑战,我们需要更好的系统,让专业人士能够无缝地将AI工具整合到他们的工作流程中——而不需要成为AI专家。
- 超大AI模型的兴起
大型语言模型由大量参数构成,这些参数在训练过程中被微调。我们在2024年看到的模型通常具有1到2万亿参数。展望未来,新一代模型的规模预计会更大,可能超过50万亿参数。
随着2024年接近尾声,我们看到了像ChatGPT的Gemini 2.0和o3这样的发布,这表明了这些发展的方向。毫不意外,这些更先进的模型也为全新的商业机会铺平了道路。
- 小型AI模型的潜力
虽然我们谈到了更大模型的兴起,但小型模型也有着巨大的潜力。这些只有几十亿参数的模型(尽管听起来依然很多)不需要装满GPU的大型数据中心来运行。相反,它们可以在笔记本电脑甚至智能手机上运行。
例如,IBM的Granite 3模型。仅拥有20亿参数,它可以在笔记本电脑上运行而无需大量计算能力。
展望未来,我们可能会看到更多这样的模型,它们针对特定任务量身定制,提供高效解决方案,而不需要大量资源。
- AI通向近乎无限记忆的道路
我仍然记得第一次使用生成式AI帮助写邮件的经历。当时,大型语言模型的上下文窗口仅有2000个标记。而如今的模型可以处理数十万甚至数百万个标记,目标是实现近乎无限的记忆——也就是机器人能够始终记住它们关于我们的所有信息。
我们正接近这样一个时代,客服聊天机器人可以记住与我们的每一次对话。起初,这似乎是一个积极的发展——但真的是这样吗?
- AI应用的演进
您知道2024年AI在商业中最常见的应用是什么吗?
根据Harris的一项调查,AI主要用于提升客户体验、改进IT运营与自动化、驱动虚拟助手和增强网络安全。
进入2025年后,我们可以期待更先进的应用场景。随着多模态能力的日益成熟,客户服务机器人可能会处理更复杂的问题,而不仅仅是生成支持工单。我们或许还会看到AI系统主动优化整个IT网络,或是实时适应新威胁的安全工具。
- 推理时间的重要性
在推理过程中,模型处理实时数据,将用户的查询与训练过程中学习的信息进行比较。在这一过程中,新的AI模型正在扩展其推理能力,本质上是在生成响应前“花时间思考”。所需时间取决于推理所需的复杂程度。简单查询可能只需一两秒,但更复杂或大规模的请求可能需要几分钟。
推理时间计算的吸引力在于,推理过程可以被微调和改进,而无需重新训练或修改底层模型。这为增强大型语言模型的推理能力提供了两个关键机会:一是在训练中使用更高质量的数据,二是在推理过程中通过优化思维链路进行改进。
这种双重方法最终可能使AI代理显得“更聪明”。
您认为2025年还会出现哪些AI相关的重大趋势?
浙公网安备 33010602011771号