摘要: 城市交通信号控制的综合应用计算框架 构建混合计算框架 构建城市交通真实环境 构建城市交通仿真环境 城市多交叉路口交通信号控制组合算法 算法背景 现存研究存在以下不足: (1) 现有的交通仿真环境无法模拟更加接近真实的交通环境,导致城市交通信号仿真控制效果和实际路测效果具有一定差距,不能完全体现真实城 阅读全文
posted @ 2021-11-02 21:09 一丨 阅读(428) 评论(0) 推荐(0) 编辑
摘要: 纳什均衡理论基本概念 基本概念 纳什均衡:要其他参与者不改变自己的策略的情况下,没有任何一个参与者可以通过改变策略获得更多的收益。任何静态的博弈至少有一个纳什均衡。 多交叉路口交通信号控制问题 多交叉路口交通信号控制就是在城市的多个路口,同时控制不同路口的交通信号,形成一个联合控制动作,提升城市整体 阅读全文
posted @ 2021-11-01 11:51 一丨 阅读(1201) 评论(1) 推荐(0) 编辑
摘要: 摘要 成果: (1) 建立城市多交叉路口交通流量时间序列文本数据集 (Multi-Road Traffic Dataset,MTD),构建城市仿真环境 (Urban Simulation Environment, USE),实现接近真实路况的多个交叉路口运行情况仿真。 (2) 促进 MARL 理论、 阅读全文
posted @ 2021-10-26 10:53 一丨 阅读(1292) 评论(1) 推荐(1) 编辑
摘要: 算法流程图 Q-learning SARSA 对比:Q-learning算法根据当前状态 S 选择执行一个动作A,执行后观测执行后的奖励和转移到的状态S1。在状态S1下计算采取哪个a可以获得最大的Q值,并没有真的采取这个a。Q-learning选择到新状态之后能够得到的最大的Q值来更新当前的Q值。 阅读全文
posted @ 2021-10-18 20:12 一丨 阅读(257) 评论(0) 推荐(0) 编辑
摘要: 简介 Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你 阅读全文
posted @ 2021-10-17 20:56 一丨 阅读(98) 评论(0) 推荐(0) 编辑
摘要: 程序用例: a=[[1,2],[4,5]] b=[0]len(a)//a的列表个数为len,b为一个将0重复len次的列表。 d=0len(a) print("len(a)=",len(a)) print("b=",b) print("d=",d) print(2 * [1,2])//将[1,2]重 阅读全文
posted @ 2021-10-17 13:45 一丨 阅读(159) 评论(0) 推荐(0) 编辑
摘要: 三、顺序博弈 马尔可夫博弈中的强化学习 值迭代 在多智能体Q学习方法中,智能体不是简单地学习估计每个状态动作对的Q(s,a),而是给出采取联合动作 状态s中的动作α= a1,...,an来估计Q(s,a)。智能体对其在州s中采取行动时将获得的未来奖励没有一个单一的估计。在学习过程中,agent选择一 阅读全文
posted @ 2021-10-12 22:37 一丨 阅读(155) 评论(0) 推荐(0) 编辑
摘要: 一、引言 多智能体强化学习的标准模型: 多智能体产生动作a1,a2.....an联合作用于环境,环境返回当前的状态st和奖励rt。智能体接受到系统的反馈st和ri,根据反馈信息选择下一步的策略。 二、重复博弈 正规形式博弈 定义:正规形式的博弈是一个元组(n,A1,...,n,R1,...,n) n 阅读全文
posted @ 2021-10-11 20:37 一丨 阅读(197) 评论(0) 推荐(0) 编辑
摘要: 第二章 比较验证 (1)假设检验 在包含m个样本的测试集上,泛化错误率为的学习器被测得测试错误率为的概率是: 其中表示在m个样本中选出个的取法个数。 在时,在时最大。越大时越小。 如在=0.3时,10个样本中测得3个被误分类的概率最大。m=10,=0.3时, 假设≤,则在置信度1-α的概率内所能观测 阅读全文
posted @ 2021-10-10 10:22 一丨 阅读(106) 评论(0) 推荐(0) 编辑
摘要: 第二章 经验误差和过拟合 错误率E 精度=1-E 训练误差:又称经验误差,是学习器在训练集上的误差。 泛化误差:在新样本上的误差 希望得到的:在新样本上能表现的很好的学习器 过拟合:学习器把训练样本学的“太好”,可能把训练样本自身的一些特点当作所有潜在样本都具有的一般特性,会导致泛化性能下降。(可能 阅读全文
posted @ 2021-10-08 22:15 一丨 阅读(95) 评论(0) 推荐(0) 编辑