摘要:
工具 铅笔:2B 木炭条: 橡皮:硬橡皮,软橡皮,电动橡皮 小刀: 接笔器: 擦笔 素描纸:8k 160g 画架: 胶带: 夹子
阅读全文
posted @ 2021-07-29 20:57
A2he
阅读(84)
推荐(0)
摘要:
标量函数backward import torch from torch.autograd import Variable import torch.nn as nn import torch.nn.functional as F #反向传播 x = torch.ones(2, 2, require
阅读全文
posted @ 2021-06-27 12:05
A2he
阅读(627)
推荐(0)
摘要:
import torch from torch.autograd import Variable import torch.nn as nn import torch.nn.functional as F import torch.optim as optim # 定义网络 class Net(nn
阅读全文
posted @ 2021-06-27 10:43
A2he
阅读(41)
推荐(0)
摘要:
import torch from torch.autograd import Variable import torch.nn as nn import torch.nn.functional as F #反向传播 x = torch.ones(2, 2, requires_grad=True)
阅读全文
posted @ 2021-06-27 10:38
A2he
阅读(180)
推荐(0)
摘要:
参考博主:https://blog.csdn.net/weixin_41457494/article/details/86238443 import torch from torch.autograd import Variable import torch.nn as nn import torc
阅读全文
posted @ 2021-06-27 10:23
A2he
阅读(159)
推荐(0)
摘要:
前言 2021/6/24 - 2021? #第一编 史前人类 第一章 人类-食物采集者 一 从类人猿到人类 从宏观的角度看,地球发展进程有两个转折点。一个是无机物发展成生命形式。一个是人类的出现。对于第一个转折点,进化的形式还是基因突变,基因适应环境;而第二个转折点人类的出现则改变了这一现象,人类从
阅读全文
posted @ 2021-06-24 21:57
A2he
阅读(1136)
推荐(0)
摘要:
value iteration和policy iteration的区别 value iteration: ①多次迭代Bellman最优等式和Bellman等式,等价值函数收敛后,②再用价值函数带入贝尔曼等式得到动作价值函数,策略就从最大的动作价值函数选取。(策略没有参与) policyiterati
阅读全文
posted @ 2021-04-29 11:14
A2he
阅读(600)
推荐(0)
摘要:
马尔科夫奖励过程MRP 状态转移函数:\(P\left(S_{t+1}=s^{\prime} \mid s_{t}=s\right)\) 奖励函数:\(R\left(s_{t}=s\right)=\mathbb{E}\left[r_{t} \mid s_{t}=s\right]\) 回报:\(\ma
阅读全文
posted @ 2021-04-27 21:20
A2he
阅读(414)
推荐(0)
摘要:
调用函数里没有写return 乌鸦.......
阅读全文
posted @ 2021-04-25 09:38
A2he
阅读(480)
推荐(0)
摘要:
满射 A mapping \(T: \mathbb{R}^{n} \rightarrow \mathbb{R}^{m}\) is said to be onto \(\mathbb{R}^{m}\) if each \(\mathbf{b}\) in \(\mathbb{R}^{m}\) is th
阅读全文
posted @ 2021-04-24 11:22
A2he
阅读(2160)
推荐(0)