我的随笔(第248页) - Angry_Panda - 博客园

我的随笔

强化学习论文（Scalable agent alignment via reward modeling: a research direction） Angry_Panda 2019-02-28 09:26 阅读:1599 评论:0 推荐:0

github上DQN代码的环境搭建，及运行（Human-Level Control through Deep Reinforcement Learning）conda配置 Angry_Panda 2019-02-26 12:02 阅读:3397 评论:6 推荐:0

Linux服务器新建用户和组，并分配sudo权限（Ubuntu系统） Angry_Panda 2019-02-25 19:36 阅读:8155 评论:0 推荐:0

不要为了虚荣心而让孩子过早的学习人工智能 (转) Angry_Panda 2019-02-25 15:13 阅读:276 评论:1 推荐:0

Linux网络代理软件***-libev的服务器端与客户端 Angry_Panda 2019-02-07 08:15 阅读:14 评论:0 推荐:0

gcc/g++多版本切换 (ubuntu18.04) Angry_Panda 2019-02-04 15:09 阅读:12392 评论:0 推荐:0

笔记本1050ti显卡安装最新驱动版本（415.27）记录 NVIDIA显卡GeForce系列（Ubuntu18.04） Angry_Panda 2019-02-04 06:57 阅读:17451 评论:0 推荐:0

Anaconda 的基本使用 Angry_Panda 2019-02-03 10:32 阅读:5902 评论:0 推荐:0

安装 aconda 后Linux的终端界面前部出现（base）字样 Angry_Panda 2019-02-03 08:21 阅读:49920 评论:2 推荐:9

基于值函数的强化学习小例子（策略退化） Angry_Panda 2019-01-24 15:20 阅读:2454 评论:0 推荐:0

公告

导航