2025年12月24日
摘要: 阿里巴巴通义实验室推出的 EcomBench,这是一个专门为评估人工智能智能体在真实电商场景中表现而设计的基准测试。研究者认为现有的 AI 测试过于偏向学术理论,因此通过人工参与的方式,从亚马逊等平台提取真实的用户需求,构建了涵盖营销策略、成本定价和法律咨询等七大领域的实战考题。测试结果显示,尽管 阅读全文
posted @ 2025-12-24 10:11 PetterLiu 阅读(32) 评论(0) 推荐(0)