群体智能方向调研
Benchmark:
DevBench:比较模型和人类语言学习发展过程。
MLAgentBench:
MLE-bench:kaggle
AIOS:
WebArena:Web 任务
WorkArena
WorkArena++
MindSearch:搜索
Multi-Agent case:
ChatDev:软件开发,拆分流程,链式通信
AgentVerse:多代理框架
转载注意标注出处:
转自Cold_Chair的博客+原博客地址
Benchmark:
DevBench:比较模型和人类语言学习发展过程。
MLAgentBench:
MLE-bench:kaggle
AIOS:
WebArena:Web 任务
WorkArena
WorkArena++
MindSearch:搜索
Multi-Agent case:
ChatDev:软件开发,拆分流程,链式通信
AgentVerse:多代理框架