强化学习论文(Scalable agent alignment via reward modeling: a research direction)
Angry_Panda 2019-02-28 09:26
阅读:1599
评论:0
推荐:0
我的随笔
github上DQN代码的环境搭建,及运行(Human-Level Control through Deep Reinforcement Learning)conda配置
Angry_Panda 2019-02-26 12:02
阅读:3397
评论:6
推荐:0
Linux服务器新建用户和组,并分配sudo权限 (Ubuntu系统)
Angry_Panda 2019-02-25 19:36
阅读:8155
评论:0
推荐:0
不要为了虚荣心而让孩子过早的学习人工智能 (转)
Angry_Panda 2019-02-25 15:13
阅读:276
评论:1
推荐:0
Linux网络代理软件***-libev的服务器端与客户端
Angry_Panda 2019-02-07 08:15
阅读:14
评论:0
推荐:0
gcc/g++多版本切换 (ubuntu18.04)
Angry_Panda 2019-02-04 15:09
阅读:12392
评论:0
推荐:0
笔记本1050ti显卡安装最新驱动版本 (415.27) 记录 NVIDIA显卡GeForce系列 (Ubuntu18.04)
Angry_Panda 2019-02-04 06:57
阅读:17451
评论:0
推荐:0
Anaconda 的基本使用
Angry_Panda 2019-02-03 10:32
阅读:5902
评论:0
推荐:0
安装 aconda 后Linux的终端界面前部出现(base)字样
Angry_Panda 2019-02-03 08:21
阅读:49920
评论:2
推荐:9
基于值函数的强化学习 小例子(策略退化)
Angry_Panda 2019-01-24 15:20
阅读:2454
评论:0
推荐:0
浙公网安备 33010602011771号