摘要: 强化学习 马尔科夫决策过程(MDP) 1、强化学习介绍 ​ 强化学习任务通常使用马尔可夫决策过程(Markov Decision Process,简称MDP)来描述,具体而言:机器处在一个环境中,每个状态为机器对当前环境的感知;机器只能通过动作来影响环境,当机器执行一个动作后,会使得环境按某种概率转 阅读全文
posted @ 2020-06-06 16:43 jsfantasy 阅读(8830) 评论(0) 推荐(5) 编辑
摘要: 深度卷积生成对抗网络(DCGAN) 生成 MNIST 手写图片 1、基本原理 生成对抗网络(GAN)由2个重要的部分构成: 生成器(Generator):通过机器生成数据(大部分情况下是图像),目的是“骗过”判别器 判别器(Discriminator):判断这张图像是真实的还是机器生成的,目的是找出 阅读全文
posted @ 2020-06-06 16:39 jsfantasy 阅读(3574) 评论(1) 推荐(1) 编辑