群体智能方向调研

Benchmark：
DevBench：比较模型和人类语言学习发展过程。
MLAgentBench：
MLE-bench：kaggle

AIOS：
WebArena：Web 任务
WorkArena
WorkArena++
MindSearch：搜索

Multi-Agent case：
ChatDev：软件开发，拆分流程，链式通信
AgentVerse：多代理框架

posted @ 2024-10-17 16:50 Cold_Chair 阅读(66) 评论(0) 收藏举报

刷新页面返回顶部