摘要: 1、策略梯度介绍 相比与DQN,策略梯度方法的区别主要在于,我们对于在某个状态下所采取的动作,并不由一个神经网络来决定,而是由一个策略函数来给出,而这个策略函数的目的,就是使得最终的奖励的累加和最大,这也是训练目标,所以训练会围绕策略函数的梯度来进行。 2、策略函数 以Reinforce算法为例, 阅读全文
posted @ 2023-08-03 17:59 想成为编程高手的阿曼 阅读(219) 评论(0) 推荐(0) 编辑
摘要: 1、html的基本结构 a.首先是注释信息,在html中使用<!--xxx-->这样的方式来进行注释 b.DOCTYPE,这是告诉浏览器所使用规范,一般可以不加这个,因为现在的浏览器默认所使用的规范为html c.head标签,表示网页的头部,其中会放入其他标签 d.meta标签,这是一个描述性的标 阅读全文
posted @ 2023-08-02 10:11 想成为编程高手的阿曼 阅读(48) 评论(0) 推荐(0) 编辑
摘要: 1、DQN算法介绍 DQN算与sarsa算法和Q-learning算法类似,对于sarsa和Q-learning,我们使用一个Q矩阵,记录所有的state(状态)和action(动作)的价值,不断学习更新,最后使得机器选择在某种状态下,价值最高的action进行行动。但是当state和action的 阅读全文
posted @ 2023-07-31 10:04 想成为编程高手的阿曼 阅读(142) 评论(0) 推荐(0) 编辑
摘要: 5、获取请求参数 在Go语言中,获取请求参数非常的简单 对于接受前端的数据有两种方式,比如这里接受userid和username,可以有usl?userid=xxx&username=xxx或者/user/info/xxx/xxx,对于前者我们可以使用Query函数来完成譬如以下代码块 //usl? 阅读全文
posted @ 2023-07-23 20:47 想成为编程高手的阿曼 阅读(13) 评论(0) 推荐(0) 编辑
摘要: 4、响应页面 首先创建 template 文件夹将需要的 hmtl 文件放在里面,然后编写 hmtl <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>我的GO web页面</title> <link rel= 阅读全文
posted @ 2023-07-21 23:28 想成为编程高手的阿曼 阅读(22) 评论(0) 推荐(0) 编辑
摘要: 4、响应页面 首先创建template文件夹将需要的hmtl文件放在里面,然后编写hmtl <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>我的GO web页面</title> <link rel="styl 阅读全文
posted @ 2023-07-21 23:22 想成为编程高手的阿曼 阅读(13) 评论(0) 推荐(0) 编辑
摘要: 1、环境配置 在GO语言中,使用"go get"命令获取相关包"go get"命令的作用与“git clone”类似,这里使用: go get -u github.com/gin-gonic/gin 来获取,相关代理问题可以参考以下链接: (19条消息) 解决GO安装gin框架(go get -u 阅读全文
posted @ 2023-07-21 13:00 想成为编程高手的阿曼 阅读(44) 评论(0) 推荐(0) 编辑
摘要: 在近期开始学习 Go 语言的过程中,发现 Go 语言中函数的作用和函数的使用,与过去在学校学习的 C 语言以及 python 中所使用的方式很不一样(也可能只是我才疏学浅),所以记录一下 Go 语言的函数学习心得。 1、函数的本质 在 Go 语言中,函数的本质是一种数据类型,就如同 int,floa 阅读全文
posted @ 2023-07-19 23:11 想成为编程高手的阿曼 阅读(11) 评论(0) 推荐(0) 编辑