2019 年 12月随笔档案 - yg_staring

tensorflow-笔记02

摘要：TensorFlow扩展功能自动求导、子图的执行、计算图控制流、队列/容器 1.TensorFlow自动求导在深度学习乃至机器学习中，计算损失函数的梯度是最基本的需求，因此TensorFlow也原生支持自动求导。比如，一个tensor C，在计算图中有一组依赖的tensor{Xk｝，那么在Te 阅读全文

posted @ 2019-12-21 20:06 yg_staring 阅读(438) 评论(0) 推荐(0)

深度学习-框架介绍

摘要：1.Caffe Caffe是一个清晰而高效的深度学习框架，也是一个被广泛使用的开源深度学习框架，在Tensorflow出现之前一直是深度学习领域Github star最多的项目。主要优势为：上手容易，网络结构都是以配置文件形式定义，不需要用代码设计网络。训练速度快，组件模块化，可以方便的拓展到新的模阅读全文

posted @ 2019-12-05 20:34 yg_staring 阅读(1217) 评论(0) 推荐(0)

深度学习-深度强化学习(DRL)-Policy Gradient与PPO笔记

摘要：Policy Gradient 初始学习李宏毅讲的强化学习，听台湾的口音真是费了九牛二虎之力，后来看到有热心博客整理的很细致，于是转载来看，当作笔记留待复习用，原文链接在文末。看完笔记再去听一听李宏毅老师的视频，就可以听懂个大概了。当然了还有莫凡的强化学习更具实战性，听莫凡的课基本上可以带我们入门。阅读全文

posted @ 2019-12-04 20:37 yg_staring 阅读(4539) 评论(0) 推荐(1)

深度学习-强化学习(RL)概述笔记

摘要：强化学习(Reinforcement Learning)简介强化学习是机器学习中的一个领域，强调如何基于环境而行动，以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论，即有机体如何在环境给予的奖励或惩罚的刺激下，逐步形成对刺激的预期，产生能获得最大利益的习惯性行为。它主要包含四个元素，环阅读全文

posted @ 2019-12-04 17:05 yg_staring 阅读(3565) 评论(0) 推荐(0)

yang_guo

12 2019 档案

公告