随笔列表第2页 - Dsp Tian

2024年6月20日

解决tensorboard报错ValueError: Duplicate plugins for name projector

摘要： tensorflow和tensorboard都正常安装之后。输入: tensorboard --logdir=results/logs 报出ValueError: Duplicate plugins for name projector错误。原因可能是命令前没加sudo。执行: sudo te 阅读全文

posted @ 2024-06-20 22:17 Dsp Tian 阅读(52) 评论(0) 推荐(0) 编辑

2024年6月14日

解决#error -- unsupported GNU version! gcc versions later than 11 are not supported!

摘要： ubuntu系统gcc版本太高导致cuda编译报错，可以手动切换gcc版本： #切换gcc版本 sudo update-alternatives --config gcc #切换g++版本 sudo update-alternatives --config g++ 阅读全文

posted @ 2024-06-14 22:28 Dsp Tian 阅读(56) 评论(0) 推荐(0) 编辑

2024年6月8日

【Python】DQN处理CartPole-v1

摘要： DQN是强化学习中的一种方法，是对Q-Learning的扩展。通过引入深度神经网络、经验回放和目标网络等技术，使得Q-Learning算法能够在高维、连续的状态空间中应用，解决了传统Q-Learning方法在这些场景下的局限性。 Q-Learning可以见之前的文章。算法的几个关键点： 1. 深阅读全文

posted @ 2024-06-08 16:09 Dsp Tian 阅读(45) 评论(0) 推荐(0) 编辑

2024年6月1日

matlab练习程序（LQR路径跟踪）

摘要： LQR 是一种优化控制方法，设计目标是找到一组控制输入，使得线性系统的状态轨迹尽可能地接近目标，同时使控制输入尽可能小。其目标函数是一个二次型成本函数。分为以下几个步骤： 1. 设系统动态方程为：其中x为状态量，u为控制输入，A和B为状态转移和控制矩阵。 2. 定义一个性能指标，即控制器的优化目阅读全文

posted @ 2024-06-01 16:47 Dsp Tian 阅读(60) 评论(0) 推荐(0) 编辑

2024年5月18日

【Python】强化学习SARSA走迷宫

摘要：之前有实现Q-Learning走迷宫，本篇实现SARSA走迷宫。 Q-Learning是一种off-policy算法，当前步采取的决策action不直接作用于环境生成下一次state，而是选择最优的奖励来更新Q表。更新公式： SARSA是一种on-policy算法，当前步采取的策略action既直阅读全文

posted @ 2024-05-18 20:36 Dsp Tian 阅读(73) 评论(0) 推荐(0) 编辑

2024年5月16日

matlab练习程序（线性常微分方程组矩阵解）

摘要：之前有通过ode和simulink解线性常微分方程组。除了上面两种方法，线性常微分方程组还可以通过矩阵的方法求解。比如下面这个之前使用的方程组： x'' = x' - x + y' -z' y'' = y' - y - x' z'' = z' - z + x' 可以写成下面矩阵形式：设这个矩阵阅读全文

posted @ 2024-05-16 23:03 Dsp Tian 阅读(71) 评论(0) 推荐(1) 编辑

2024年5月12日

【Python】保存gym截图

摘要：如果想做基于图像cnn的深度强化学习，需要拿到gym的截图，下面是两种截图方法。 1. 利用render结果生成图像： import gym import warnings import os from PIL import Image warnings.filterwarnings("ignore 阅读全文

posted @ 2024-05-12 20:21 Dsp Tian 阅读(32) 评论(0) 推荐(0) 编辑

2024年4月29日

【Python】Q-Learning处理CartPole-v1

摘要：上一篇配置成功gym环境后，就可以利用该环境做强化学习仿真了。这里首先用之前学习过的qlearning来处理CartPole-v1模型。 CartPole-v1是一个倒立摆模型，目标是通过左右移动滑块保证倒立杆能够尽可能长时间倒立，最长步骤为500步。模型控制量是左0、右1两个。模型状态量为下阅读全文

posted @ 2024-04-29 21:08 Dsp Tian 阅读(106) 评论(0) 推荐(0) 编辑

2024年4月20日

【Python】安装配置gym

摘要： gym是python中的一个强化学习环境，想要完整配置并跑起来坑还是比较多的。下面记录一下Windows完整安装过程，Linux下过程基本类似。 1. 执行pip install gym直接安装的是0.26.2版本，网上常见的代码无法兼容，这里安装0.25.2版，并且安装对应的pygame。执行阅读全文

posted @ 2024-04-20 12:58 Dsp Tian 阅读(1532) 评论(0) 推荐(0) 编辑

2024年4月5日

matlab练习程序（Pure Pursuit路径跟踪）

摘要：当时写stanley就实现了，贴上来记录一下。方法示意图：控制率公式：其中L为轴距，e为横向误差，v为车辆速度，lambda和c为控制参数。算法步骤如下： 1. 根据当前定位结果找到路径最邻近点。 2. 计算该点与定位结果横向误差e。 3. 根据控制率公式计算出前轮转角。 4. 将前轮转角转阅读全文

posted @ 2024-04-05 17:24 Dsp Tian 阅读(88) 评论(0) 推荐(0) 编辑

Dsp Tian

公告