2020 年 6月 6 日随笔档案 - jsfantasy

2020年6月6日

摘要：强化学习马尔科夫决策过程（MDP） 1、强化学习介绍强化学习任务通常使用马尔可夫决策过程（Markov Decision Process，简称MDP）来描述，具体而言：机器处在一个环境中，每个状态为机器对当前环境的感知；机器只能通过动作来影响环境，当机器执行一个动作后，会使得环境按某种概率转阅读全文

posted @ 2020-06-06 16:43 jsfantasy 阅读(8830) 评论(0) 推荐(5) 编辑

卷积生成对抗网络（DCGAN）---生成手写数字

摘要：深度卷积生成对抗网络（DCGAN）生成 MNIST 手写图片 1、基本原理生成对抗网络（GAN）由2个重要的部分构成：生成器(Generator)：通过机器生成数据（大部分情况下是图像），目的是“骗过”判别器判别器(Discriminator)：判断这张图像是真实的还是机器生成的，目的是找出阅读全文

posted @ 2020-06-06 16:39 jsfantasy 阅读(3574) 评论(1) 推荐(1) 编辑

jsfantasy

公告