摘要: https://github.com/pyro-ppl/pyro Algorithm 4 Compute Gradient Estimator for Stochastic Computation Graph for v 2 Graph do . Initialization at output n 阅读全文
posted @ 2026-04-29 08:42 Angry_Panda 阅读(10) 评论(0) 推荐(0)

摘要: https://gitee.com/dearxie/zero-robotic-arm 阅读全文
posted @ 2026-04-24 13:03 Angry_Panda 阅读(8) 评论(0) 推荐(0)

摘要: 相关: 面向分布式强化学习的经验回放框架(使用例子Demo)——Reverb: A Framework for Experience Replay 阅读全文
posted @ 2025-03-01 19:40 Angry_Panda 阅读(92) 评论(0) 推荐(0)

摘要: https://sites.google.com/view/humanoid-gym/ 阅读全文
posted @ 2024-05-07 11:26 Angry_Panda 阅读(409) 评论(0) 推荐(0)
摘要: https://research.nvidia.com/labs/gear/ 阅读全文
posted @ 2024-05-07 11:22 Angry_Panda 阅读(175) 评论(0) 推荐(0)
摘要: 打开下方网址,用上面发您的卡密登录,从入口进入搜索下载即可。 网址: https://www.xueshu789.cc/ 卡号:805974162 密码:824790 【注意事项】 首次使用请阅读下图说明,以免操作错误无法进入。 拍下24小时内帮小店五字以上美言,联系客服再送您查重软件。感谢您的支持 阅读全文
posted @ 2024-05-07 07:55 Angry_Panda 阅读(109) 评论(0) 推荐(0)

摘要: 论文: LEARNING VISION-GUIDED QUADRUPEDAL LOCOMOTION END-TO-END WITH CROSS-MODAL TRANSFORMERS 发表于ICLR2022 相关: https://zhuanlan.zhihu.com/p/581786377 阅读全文
posted @ 2024-05-06 18:44 Angry_Panda 阅读(290) 评论(0) 推荐(0)
摘要: 论文地址: https://arxiv.org/abs/2010.11929 Github地址: https://github.com/google-research/vision_transformer 阅读全文
posted @ 2024-05-06 18:03 Angry_Panda 阅读(84) 评论(0) 推荐(0)
摘要: 项目地址: https://openai.com/index/clip Github代码地址: https://github.com/openai/CLIP 阅读全文
posted @ 2024-05-06 17:16 Angry_Panda 阅读(137) 评论(0) 推荐(0)
摘要: https://www.understandingai.org/p/large-language-models-explained-with https://arxiv.org/abs/1905.05950 https://arxiv.org/abs/2012.14913 https://arxiv 阅读全文
posted @ 2024-05-06 14:11 Angry_Panda 阅读(200) 评论(0) 推荐(0)
摘要: GitHub地址: https://github.com/mit-han-lab/efficientvit#usage 相关: https://www.jetson-ai-lab.com/vit/tutorial_efficientvit.html 阅读全文
posted @ 2024-05-06 10:38 Angry_Panda 阅读(89) 评论(0) 推荐(0)

摘要: 项目地址: https://mobile-aloha.github.io/ 演示视频地址: https://www.youtube.com/watch?v=HaaZ8ss-HP4 论文地址: https://mobile-aloha.github.io/resources/mobile-aloha. 阅读全文
posted @ 2024-05-04 15:25 Angry_Panda 阅读(157) 评论(0) 推荐(0)
摘要: 地址: https://lucho1.github.io/JumpPointSearch/ 原作者还开发了A* 算法的Windows系统上的小程序:(重点:小程序意义不大,这个综述还是不赖的) 项目地址:https://github.com/lucho1/JumpPointSearch 重点: 这个 阅读全文
posted @ 2024-05-04 12:49 Angry_Panda 阅读(174) 评论(0) 推荐(0)
摘要: 地址: http://mapf.info/index.php/Main/Publications 与其对应的实验室地址: https://www.movingai.com/ 阅读全文
posted @ 2024-05-04 07:40 Angry_Panda 阅读(298) 评论(0) 推荐(0)

摘要: 视频地址: 周志华团队与Intel团队的讲座视频——强化学习的局限性与未来展望 视频链接地址: https://bizwebcast.smarket.com.cn/b975d6d9969a42cba9626adb7669676b/2a1fc2d76a65403cb76f99acd5b025da-8a 阅读全文
posted @ 2023-12-22 12:56 Angry_Panda 阅读(191) 评论(0) 推荐(0)

摘要: 作为reinforcement learning的一个入门学习的项目,spinningup的地址: (英文原版:) https://spinningup.openai.com/en/latest/index.html (中文翻译版:) https://spinningup.readthedocs.i 阅读全文
posted @ 2023-04-18 09:07 Angry_Panda 阅读(79) 评论(0) 推荐(0)

摘要: 相关: 【转载】 推荐算法之Thompson(汤普森)采样 【转载】 推荐系统 EE 问题与 Bandit 算法 python语言绘图:绘制一组beta分布图 转载: beta分布介绍 python语言绘图:绘制一组以beta分布为先验,以二项分布为似然的贝叶斯后验分布图 深入理解什么是Beta分布 阅读全文
posted @ 2023-01-01 13:13 Angry_Panda 阅读(2578) 评论(0) 推荐(0)
摘要: 源代码地址: https://github.com/tensorflow/agents TensorFlow给出的官方文档说明: https://tensorflow.google.cn/agents 相关视频: https://www.youtube.com/watch?v=U7g7-Jzj9qo 阅读全文
posted @ 2023-01-01 13:12 Angry_Panda 阅读(407) 评论(0) 推荐(0)

摘要: 深度学习这个概念已经火了好些年了,前些年刚开始的时候大家都不清除那些深度学习的框架是什么原理,in other words,大家都是只知道用这些深度学习框架,但是没有几个人真的了解这个框架的原理是什么,不过随着这几年开源的相关资料越来越多,慢慢的这也不是当年的什么高深秘密了,当年所有的深度学习框架都 阅读全文
posted @ 2022-11-17 19:29 Angry_Panda 阅读(904) 评论(0) 推荐(0)

2026年5月13日

摘要: bing 基于规则模板的深度强化学习决策算法 http://www.uml.org.cn/modeler/202404183.asp https://blog.csdn.net/weixin_36311421/article/details/153009518 阅读全文
posted @ 2026-05-13 14:54 Angry_Panda 阅读(4) 评论(0) 推荐(0)

2026年5月10日

摘要: Limited Sensors: For this variation, we restrict the obser- vations to only provide positional information (including joint angles), excluding velocit 阅读全文
posted @ 2026-05-10 15:14 Angry_Panda 阅读(7) 评论(0) 推荐(0)

2026年5月9日

摘要: Adaptive step size for Adam optimizer Adam stepsize was adjusted based on the target value of the KL divergence vanilla policy gradient with adaptive 阅读全文
posted @ 2026-05-09 23:29 Angry_Panda 阅读(9) 评论(0) 推荐(0)
摘要: I. Szita and A. L¨orincz. “Learning Tetris using the noisy cross-entropy method”. In: Neural computation 18.12 (2006), pp. 2936–2941. 阅读全文
posted @ 2026-05-09 22:47 Angry_Panda 阅读(6) 评论(0) 推荐(0)
摘要: 相关: https://www.sysgeek.cn/windows-11-hibernate/#google_vignette 关闭休眠功能(系统会自动删除休眠文件): powercfg -h off 打开休眠功能: powercfg /hibernate on 切记,需要使用管理员权限。 阅读全文
posted @ 2026-05-09 21:16 Angry_Panda 阅读(5) 评论(0) 推荐(0)

2026年5月6日

摘要: 地址: https://github.com/CHAOZHAO-1/HUSTmotor-multi-modal-dataset 阅读全文
posted @ 2026-05-06 22:13 Angry_Panda 阅读(8) 评论(0) 推荐(0)

2026年5月3日

摘要: python报错: raise Exception('ROM is missing for %s, see https://github.com/openai/atari-py#roms for instructions' % (game_name,)) Exception: ROM is miss 阅读全文
posted @ 2026-05-03 16:07 Angry_Panda 阅读(6) 评论(0) 推荐(0)

2026年4月28日

摘要: Why Don’t You Just Use a Q-Function? Previous actor critic methods, e.g. in [KT03], use a Q-function to obtain potentially low-variance policy gradien 阅读全文
posted @ 2026-04-28 12:29 Angry_Panda 阅读(4) 评论(0) 推荐(0)
摘要: 资料: https://digitalassets.lib.berkeley.edu/techreports/ucb/text/EECS-2016-217.pdf 时变基线 The time-dependent baseline was computed by averaging the retur 阅读全文
posted @ 2026-04-28 10:54 Angry_Panda 阅读(5) 评论(0) 推荐(0)

导航