摘要: 由 Aphex34 (自己的作品) CC BY-SA 4.0, 通过 Wikimedia Commons 共享 由 Aphex34 (自己的作品) CC BY-SA 4.0, 通过 Wikimedia Commons 共享 由 Aphex34 (自己的作品) CC BY-SA 4.0, 通过 Wik 阅读全文
posted @ 2018-07-11 18:30 广目天王 阅读(3412) 评论(0) 推荐(0)
摘要: TensorFlow 卷积层 TensorFlow 卷积层 TensorFlow 卷积层 TensorFlow 卷积层 TensorFlow 卷积层 TensorFlow 卷积层 让我们看下如何在 TensorFlow 里面实现 CNN。 TensorFlow 提供了 tf.nn.conv2d()  阅读全文
posted @ 2018-07-11 18:18 广目天王 阅读(202) 评论(0) 推荐(0)
摘要: 在linux系统中int、float、short、double各占多少个字节 看出只有 long(长整型),void*(c语言中,void为“不确定类型”),在32位4个字节,在64位8个字节。 阅读全文
posted @ 2018-07-10 16:48 广目天王 阅读(2737) 评论(0) 推荐(0)
摘要: 梯度下降法需要遍历数据集上百次,数据集越大所花费的时间越多。而现在训练的样本集越来越大,造成梯度下降法造成的时间成本非常高,难以规模化。 随机梯度下降法,是从样本集中抽出一小部分数据(随机抽出),用来做梯度下降法。这个虽然会有一点误差,但我们每次只走一小步。他速度更快,并且更容易规模化。 ADAGR 阅读全文
posted @ 2018-07-10 15:27 广目天王 阅读(244) 评论(0) 推荐(0)
摘要: 本文使用的是linux版本的Anaconda环境 #创建名为 tensorflow的环境,设置python版本为3.5conda create -n tensorflow python=3.5 #进入 tensorflow环境source activate tensorflow #安装一些安装包co 阅读全文
posted @ 2018-06-25 16:55 广目天王 阅读(245) 评论(0) 推荐(0)
摘要: NumPy 默认是行向量。你可以用 arr.T 来对数组进行转置,但对一维数组来说,转置还是行向量。所以你可以用 arr[:,None] 来创建一个列向量: print(features) > array([ 0.49671415, -0.1382643 , 0.64768854]) print(features.T) > array([ 0.49671415, -0.1382643 ,... 阅读全文
posted @ 2018-06-20 16:44 广目天王 阅读(6942) 评论(0) 推荐(1)
摘要: puthon 中随机 概率选择 ,和随机选择 阅读全文
posted @ 2018-05-25 11:55 广目天王 阅读(1358) 评论(0) 推荐(0)
摘要: 名词解释: 零和博弈:两人的分数相加为0,也是说一个人得分,另一个就减分。 有限:也就是 数字 选择 深度等,不是无限大。他是有限制的,一个确定的数。 确定性:状态 没有概率 随机转换,比如:执行某个动作,就一定会进入某个状态。 完美信息:也就是状态可知,明确知道对方和自己所处的状态。 因为 a 先 阅读全文
posted @ 2018-05-23 18:26 广目天王 阅读(956) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2018-05-22 11:35 广目天王 阅读(236) 评论(0) 推荐(0)
摘要: 马尔科夫模型主要元素有3个部分 状态,动作,奖励。 对奖励的设置一定慎重,并且深谋远虑。如下图右侧: 绿色方块是 生 红色方块是 死,游戏目的是使agent尽快到达绿色方块。 1:动作奖励正数过高,会使agent一直在方格世界里兜圈子,不想出去。因为这样每多走一步,都会获得正的奖励。 2:动作奖励负 阅读全文
posted @ 2018-05-21 15:06 广目天王 阅读(989) 评论(0) 推荐(0)