论文速读记录 | 2025.03

Enhancing Autonomous Vehicle Training with Language Model Integration and Critical Scenario Generation

Enhancing Autonomous Vehicle Training with Language Model Integration and Critical Scenario Generation

arxiv：https://arxiv.org/abs/2404.08570
GitHub：https://github.com/zachtian/CRITICAL
来源：随机看到的文章。
主要内容：
- highway-env + LLM。
- 背景：这篇文章声称，为了增强自动驾驶的 RL 策略的安全性，需要在关键驾驶场景（如高风险、低出现频率的边缘案例）进行训练，这样可以提升策略在复杂动态环境中的安全性和适应性。
- 相关工作：生成多样化的自动驾驶场景，可以使用生成模型（如 diffusion）、进化算法和贝叶斯网络。识别关键场景，可以使用进化算法之类的方法。
- method：这篇工作使用 LLM 来生成多样化的关键场景，然后让 RL 策略在这些关键场景中训练，以增强 RL 策略的能力和安全性。
  - 首先，整理了 HighD 数据集，并分类为不同的驾驶场景；
  - 然后，对于一段时间的 RL 训练，提取这段时间 rollout 数据的特征，并将这些特征与 HighD 数据集中的信息 concat 起来，送给 LLM，让它生成一组新的 RL 训练环境的参数。
- 实验结果：相比于没有增强 RL 训练环境的 PPO 算法，和使用传统方法（？）增强训练环境的算法，碰撞次数和（自定义的）风险指标都更低。
- （感觉没有很看懂这篇文章的具体 method。

posted @ 2025-03-01 19:40 MoonOut 阅读(137) 评论(0) 收藏举报

刷新页面返回顶部