posted @ 2023-06-10 19:07
MoonOut
阅读(28)
推荐(0)
posted @ 2023-05-31 10:59
MoonOut
阅读(191)
推荐(0)
摘要:
subplots 子图,scatter 散点图,plot 连点成线,color 与 fontsize。
阅读全文
posted @ 2023-05-26 10:55
MoonOut
阅读(96)
推荐(0)
摘要:
使用 python datetime 库,实现微秒级计时。
阅读全文
posted @ 2023-05-25 21:52
MoonOut
阅读(179)
推荐(0)
摘要:
先复制粘贴,在粘贴时点“选择性粘贴”,点选“转置”。
阅读全文
posted @ 2023-05-14 10:03
MoonOut
阅读(51)
推荐(0)
摘要:
基于 14 年的 MFRL 论文,利用相邻 state-action 的空间相关性来加速学习,用 gaussian processes 建模 env dynamics(model-based)/ Q function(model-free),得到了两种跟 14 年 MFRL 很相似的算法。
阅读全文
posted @ 2023-04-16 13:21
MoonOut
阅读(169)
推荐(0)
摘要:
RL episode 长度 = 1,先用 PPO 在 low-fidelity env 上学;维护一个 reward 的方差,如果方差足够小,就从 low-fidelity env 迁移到 high-fidelity env。
阅读全文
posted @ 2023-04-15 19:51
MoonOut
阅读(52)
推荐(0)
摘要:
安利一天能免费使用 10 次且好用的工具 Mathpix。
阅读全文
posted @ 2023-04-15 18:59
MoonOut
阅读(80)
推荐(0)
摘要:
motivation:一些预算用于训 low-fidelity model,剩下预算用于 Monte Carlo 模拟,以得到结果。数学证明:近似 + 递推或迭代或归纳法。总结:目前看来,对我的工作意义不大。
阅读全文
posted @ 2023-04-15 18:56
MoonOut
阅读(191)
推荐(0)
posted @ 2023-04-14 16:11
MoonOut
阅读(1223)
推荐(0)
摘要:
markdown 写矩阵和大公式的代码存档。
阅读全文
posted @ 2023-04-12 09:33
MoonOut
阅读(102)
推荐(0)
摘要:
motivation:鼓励探索。主要方法:给 agent 不熟悉的 state 一个 intrinsic reward。关键问题:如何判断 agent 对某个 state 的熟悉程度。
阅读全文
posted @ 2023-04-06 21:58
MoonOut
阅读(943)
推荐(0)
摘要:
“我们走到了南京眼,趴在桥上看长江、灯火与晚风,享受一些天真又忧愁的少年时光。”
阅读全文
posted @ 2023-04-06 16:02
MoonOut
阅读(213)
推荐(0)
摘要:
2022 年暑假,海投夏令营时整理的材料。
阅读全文
posted @ 2023-04-04 15:06
MoonOut
阅读(25088)
推荐(6)
摘要:
2022 年暑假,海投夏令营时整理的材料。
阅读全文
posted @ 2023-04-04 14:56
MoonOut
阅读(3364)
推荐(2)
摘要:
2022 年暑假,海投夏令营时整理的材料。
阅读全文
posted @ 2023-04-04 14:47
MoonOut
阅读(4615)
推荐(3)
摘要:
Reinforcement learning with multi-fidelity simulators,是 14 年的 ICRA 会议的论文。师兄说是 robotics 顶会,但中稿率蛮高的。
阅读全文
posted @ 2023-04-03 17:26
MoonOut
阅读(333)
推荐(1)
摘要:
火焰明亮绚烂如昙花一现,但我却是极夜里沐临北斗的赶路人,在星光的鼓舞下,还有更长的路要走。
阅读全文
posted @ 2023-03-27 00:19
MoonOut
阅读(102)
推荐(0)
摘要:
啊…… 感觉它能 work 还是加了很多 tricks 的…
阅读全文
posted @ 2023-03-06 17:44
MoonOut
阅读(354)
推荐(0)
摘要:
motivation:减少 RL 试错过程中的 unsafe behavior。技术路线:先模仿学习,再在 on-line learning 时强行改可能 unsafe 的 action,即 post-hoc rectification。
阅读全文
posted @ 2023-03-05 13:13
MoonOut
阅读(147)
推荐(0)
摘要:
当你完全不想锻炼英语阅读能力,只想快速得知论文内容……
阅读全文
posted @ 2023-03-04 12:32
MoonOut
阅读(46)
推荐(0)
摘要:
主要就是 __init__, step, reset 三个方法,① __init__ 要记得定义 state action space,② step 返回 (obs, reward, done, info),③ reset 返回 obs。返回的 obs 要用 np.ndarray 表示。
阅读全文
posted @ 2023-03-03 11:03
MoonOut
阅读(432)
推荐(0)
摘要:
左下角“设置”→ 搜索 language → 把 python 的 language server 改成 pylance → 重装 pylance
阅读全文
posted @ 2023-03-02 21:52
MoonOut
阅读(14206)
推荐(1)
摘要:
① pandas 读 csv,② 基于 pytorch 的模型搭建、训练、测试。
阅读全文
posted @ 2023-03-02 15:49
MoonOut
阅读(86)
推荐(0)
摘要:
管理员打开 cmd,输入 netsh winsock reset,重启电脑就可以了。
阅读全文
posted @ 2023-02-20 21:10
MoonOut
阅读(10579)
推荐(0)
摘要:
那些湛远的天穹,红枫与梧桐的秋日,墨蓝的星月交辉的夏夜 —— 既然真真切切存在,可否带你回去?
阅读全文
posted @ 2023-02-17 22:16
MoonOut
阅读(13)
推荐(0)
posted @ 2023-02-06 14:48
MoonOut
阅读(102)
推荐(0)
posted @ 2023-01-01 23:04
MoonOut
阅读(74)
推荐(0)
摘要:
科目一备考支持。同步发表在 b 站知乎了,所以为了贴合平台风格,前面写了一堆 random 引言,还贴了几个喵喵表情 😂
阅读全文
posted @ 2023-01-01 09:30
MoonOut
阅读(2059)
推荐(0)
摘要:
但倘若细看这些照片,仍能回想起,当时的亭台楼阁,当时的移步换景,当时被美景所触动与迷惑,不由自主按下快门……
阅读全文
posted @ 2022-12-25 18:49
MoonOut
阅读(57)
推荐(0)
摘要:
随手记录我们 OS 课设的答辩经历。记于 omicron 流行的壬寅年壬子月……
阅读全文
posted @ 2022-12-22 15:00
MoonOut
阅读(241)
推荐(0)
摘要:
在装服务器 python 环境,顺便整理一下 python 虚拟环境(venv)搭建全流程
阅读全文
posted @ 2022-12-22 11:47
MoonOut
阅读(212)
推荐(0)
摘要:
把字模代码粘进正文里了,欢迎查看
阅读全文
posted @ 2022-12-04 20:18
MoonOut
阅读(424)
推荐(0)
摘要:
在简单的真实场景下,列举 git branch 系列命令的使用流程
阅读全文
posted @ 2022-11-23 21:48
MoonOut
阅读(65)
推荐(0)
摘要:
win + H 打开听写功能,即可打开语音输入,帮你快速完成文档 😉
阅读全文
posted @ 2022-11-21 16:25
MoonOut
阅读(419)
推荐(0)
摘要:
解决方案:运行 PulseSecureService 服务,然后就正常了。
阅读全文
posted @ 2022-11-14 16:56
MoonOut
阅读(1140)
推荐(0)
摘要:
栖霞山称不上四大赏枫圣地的盛名,但也不乏美景。
挨家挨户吃美食,太愉悦了。
阅读全文
posted @ 2022-11-14 15:56
MoonOut
阅读(205)
推荐(0)
摘要:
欢迎评论区留言,告诉我其他好吃的(或者其他难吃的)
阅读全文
posted @ 2022-11-03 10:08
MoonOut
阅读(933)
推荐(0)
摘要:
基于 RL 的数据中心冷却控制 —— 诶,仔细看看,真的是 RL 嘛?
阅读全文
posted @ 2022-10-08 17:32
MoonOut
阅读(950)
推荐(0)
摘要:
退化的最优解:多个约束条件交于一点。无穷多最优解:约束条件和目标函数平行。
阅读全文
posted @ 2022-09-29 21:32
MoonOut
阅读(1638)
推荐(1)