摘要:
前言 实例参考MorvanZhou/Reinforcement-learning-with-tensorflow, 更改为PyTorch实现,并增加了几处优化。实现效果如下。 其中,红色方块作为探索的智能体,到达黄色圆形块reward=1,到达黑色方块区域reward=-1. 代码 程序主循环 fr 阅读全文
摘要:
##1 简介 Anaconda:是一个开源的Python发行版本,其包含了conda、Python等软件包,numpy,pandas,scipy等科学计算包. Conda:包管理器, venv+pip的作用,也就是虚拟环境+包管理。 Nvidia: 显卡制造商。 显卡:承担输出显示图形的任务。 GP 阅读全文
摘要:
## 快捷键 Ctrl+Shift+P搜索 Ctrl+F5 运行代码 Ctrl+, 打开设置 Ctrl+Shift+E 打开文件 Ctrl+Alt+C 打开博客园 ## 功能 设置文件:settings.json 1. 隐藏以及排除git相关文件 