01 2021 档案

摘要:1、使用梯度下降法拟合y = sin(x) import numpy as np import torch import torchvision import torch.optim as optim import torch.nn as nn import torch.nn.functional 阅读全文
posted @ 2021-01-29 21:56 维和战艇机 阅读(170) 评论(0) 推荐(0)
摘要:自动求导: https://zhuanlan.zhihu.com/p/84812085 Pytorch入门教程: https://github.com/fendouai/PyTorchDocs/blob/master/SecondSection/training_a_classifier.md Py 阅读全文
posted @ 2021-01-26 18:36 维和战艇机 阅读(113) 评论(0) 推荐(0)
摘要:参考链接:https://blog.csdn.net/u013733326/article/details/80086090 大致了解卷积神经网络的实现细节,具体实现的时候直接调用相关库函数就行 # coding=utf-8 # This is a sample Python script. # P 阅读全文
posted @ 2021-01-22 17:08 维和战艇机 阅读(246) 评论(0) 推荐(0)
摘要:参考链接:https://blog.csdn.net/u013733326/article/details/79907419 代码: # coding=utf-8 # This is a sample Python script. # Press ⌃R to execute it or replac 阅读全文
posted @ 2021-01-20 16:39 维和战艇机 阅读(215) 评论(0) 推荐(0)
摘要:参考链接:https://blog.csdn.net/u013733326/article/details/79847918 与原博文不同,我直接改动了第一课第四周的作业代码,只测试了L2正则化和随机初始化的效果。L2正则化可以明显的缓解过度拟合的情况 代码: # coding=utf-8 # Th 阅读全文
posted @ 2021-01-19 20:46 维和战艇机 阅读(233) 评论(0) 推荐(0)
摘要:参考链接:https://blog.csdn.net/u013733326/article/details/79767169 搭建多层神经网络步骤: 1、初始化 2、前向传播 (1)线性部分 (2)激活部分 3、计算代价(判断有没有学习) 4、反向传播 (1)线性部分 (2)激活部分 5、更新参数 阅读全文
posted @ 2021-01-19 11:28 维和战艇机 阅读(314) 评论(0) 推荐(0)
摘要:参考链接:https://blog.csdn.net/u013733326/article/details/79702148 # coding=utf-8 # This is a sample Python script. # Press ⌃R to execute it or replace it 阅读全文
posted @ 2021-01-18 15:07 维和战艇机 阅读(204) 评论(0) 推荐(0)
摘要:1、numpy库 import numpy as np np.random.seed(1) #设置随机种子 np.log(x) #给list中的每个元素取对数 np.multiply(x, y) #list中对应元素相乘 np.dot(x, y) #矩阵乘法 np.power(x, 2) #list 阅读全文
posted @ 2021-01-18 15:04 维和战艇机 阅读(185) 评论(0) 推荐(0)
摘要:参考大佬的博客https://blog.csdn.net/u013733326/article/details/79639509 代码: # coding=utf-8 # This is a sample Python script. # Press ⌃R to execute it or repl 阅读全文
posted @ 2021-01-17 17:09 维和战艇机 阅读(214) 评论(0) 推荐(0)
摘要:刚把《强化学习》的第一部分写完,突发奇想想写一个井字棋小游戏AI,采用MCTS算法,中间采用了UCT算法作为树中策略,等概率随机作为树外策略。 代码: #include <bits/stdc++.h> using namespace std; const int maxn = 20010; doub 阅读全文
posted @ 2021-01-08 00:09 维和战艇机 阅读(578) 评论(0) 推荐(0)
摘要:本章的重点就是计算价值函数,通过DP进行迭代计算。 Vπ(s)的定义式: 迭代计算方式: 以该问题为例,编写代码加深理解: 过程图: 本图中展示的是策略不变的情况。虽然策略没变,但是仍然找到了每个状态的最优动作。 此为模拟程序在策略不改变的情况下展示的结果 策略改变: 添加了基于贪心的策略改进之后, 阅读全文
posted @ 2021-01-01 00:00 维和战艇机 阅读(159) 评论(0) 推荐(0)