摘要: pycharm中报错:Error: failed to send plot to http://127.0.0.1:63342 pycharm中报错:Error: failed to send plot to http://127.0.0.1:63342 #使用numpy实现的机器学习 import 阅读全文
posted @ 2021-08-24 20:33 乖张❤ 阅读(1402) 评论(0) 推荐(0)
摘要: **AlphaGo ** 出处: 围棋游戏用人工智能语言解释: 围棋游戏是一个19*19方格,包含361个点的规格 状态参数包括了 黑棋、白棋、格子编号 状态s可以用一个 19 * 19 * 2的tensor分别表示黑白棋的位置,有则为1,否则为0 但实际上AlphaGo用的是 19 * 19 * 阅读全文
posted @ 2021-07-22 14:50 乖张❤ 阅读(266) 评论(0) 推荐(1)
摘要: Actor—Critic Methods (actor可以看成策略网络 critic可以看成价值网络 两者关系可以比较运动员和打分的裁判员,关系可以如下: 回顾之前价值学习和策略学习的内容,带入到actor-critic方法中,状态价值函数可以有下图中的改写: 构造策略神经网络:(见P3 构造价值神 阅读全文
posted @ 2021-07-22 14:46 乖张❤ 阅读(87) 评论(0) 推荐(0)
摘要: Policy Function Approximation 策略函数 策略函数记做 π(a|s) 策略函数的输入是当前状态S 输出是一个概率分布,给每个动作一个概率值 如何得到这么一个策略函数,则需要构建一个策略神经网络,通过学习得到这么一个近似函数,还是以马里奥为例(包含左右上 三个动作,也就是三 阅读全文
posted @ 2021-07-22 14:41 乖张❤ 阅读(113) 评论(0) 推荐(0)
摘要: Deep Q-Network(DQN) \[ 对于一个游戏来说,我们的目标是为了赢得游戏(也就相当于是要去找到一个最大的总和奖励\\那么现在的目标有了,问题就是如果我们知道一个Q^*函数,应该如何做决策,也就是如何找到\\最优的动作\\ 但实际上,我们在开始是不知道Q^*的 因此我们的解决方法是 D 阅读全文
posted @ 2021-07-22 14:34 乖张❤ 阅读(65) 评论(0) 推荐(0)
摘要: 最近在跟B站视频 https://www.bilibili.com/video/BV1rv41167yx 学习深度强化学习 然后做了些简单的笔记 ###基本概念 强化学习两种随机性来源: 动作 状态转移 轨迹:包含 状态、动作、奖励 三个参数 Rewards and Returns Return:回 阅读全文
posted @ 2021-07-21 23:10 乖张❤ 阅读(631) 评论(0) 推荐(0)
摘要: Cannot open D:\anaconda\Scripts\pip-script.py 今天在安装gym包时,pip install gym报错 Cannot open D:\anaconda\Scripts\pip-script.py 查询了网上的解决方法: 打开pip-script.py所在 阅读全文
posted @ 2021-07-14 15:56 乖张❤ 阅读(1753) 评论(0) 推荐(0)
摘要: global和nonlocal作用域 python中的变量引用顺序为:当前作用域局部变量>外层作用域变量>当前模块中的全局变量>python内置变量 global: global关键字的作用就是用来在函数或者其他局部作用域中使用全局变量 例如: a=0 def a_test(): a+=1 prin 阅读全文
posted @ 2021-05-18 12:50 乖张❤ 阅读(149) 评论(0) 推荐(0)
摘要: 创建集合 #创建集合 s=set() 添加元素 #添加元素 O(1) s.add(10) s.add(3) s.add(5) s.add(2) s.add(2) print(s) #{10,2,3,5} 结果可能不止这种,但是2只出现一次 这就是集合的无序性和唯一性 搜索元素 #暂无找到直接调用的方 阅读全文
posted @ 2021-05-02 15:33 乖张❤ 阅读(50) 评论(0) 推荐(0)
摘要: 首先需要一个 import heapq的引用包 import heapq #引入heapq包 class Test: def test(self): #创建堆 这里为了后面添加 所以创建一个空堆 minheap=[] heapq.heapify(minheap)#将列表转换为堆 如果这里初始minh 阅读全文
posted @ 2021-05-02 15:32 乖张❤ 阅读(146) 评论(0) 推荐(0)