群体智能方向调研

Benchmark:
DevBench:比较模型和人类语言学习发展过程。
MLAgentBench
MLE-bench:kaggle

AIOS:
WebArena:Web 任务
WorkArena
WorkArena++
MindSearch:搜索

Multi-Agent case:
ChatDev:软件开发,拆分流程,链式通信
AgentVerse:多代理框架

posted @ 2024-10-17 16:50  Cold_Chair  阅读(33)  评论(0)    收藏  举报