上一页 1 ··· 35 36 37 38 39 40 41 42 43 ··· 269 下一页

2024年12月14日

摘要: 报错: cymj.pyx:67:5: Exception check on 'c_warning_callback' will always require the GIL to be acquired. 相关: https://github.com/openai/mujoco-py/issues/ 阅读全文
posted @ 2024-12-14 16:15 Angry_Panda 阅读(106) 评论(0) 推荐(0)
摘要: 相关: https://arxiv.org/pdf/1702.08165 首先,要知道soft-learning是一个很老的算法,其实就是在q-learning的基础上加了个soft变换,然后在探索阶段不使用epsilon-greedy探索,而是使用soft-q作为探索方法,而在训练参数时候使用的u 阅读全文
posted @ 2024-12-14 15:32 Angry_Panda 阅读(93) 评论(0) 推荐(0)
摘要: 相关: https://github.com/tensorflow/tensorflow/issues/62210 解决方法: 更换TensorFlow版本,安装2.13版本。 TF version 2.13 阅读全文
posted @ 2024-12-14 15:27 Angry_Panda 阅读(73) 评论(0) 推荐(0)
摘要: 相关地址: https://github.com/readthedocs/readthedocs.org/issues/10286 问题: 解决方法: pip install setuptools==65.5.0 阅读全文
posted @ 2024-12-14 14:35 Angry_Panda 阅读(168) 评论(0) 推荐(0)
摘要: 相关: https://www.reddit.com/r/learnmachinelearning/comments/1gy86nl/am_i_allowed_to_say_that_i_kinda_hate/ 我能这样说吗?我有点讨厌强化学习 讨论 我所有的机器学习工作经验都集中在监督学习上。我很 阅读全文
posted @ 2024-12-14 12:35 Angry_Panda 阅读(31) 评论(0) 推荐(0)
摘要: 地址: https://www.wandelbots.com/blog/machine-learning-in-robotics 机器学习在机器人技术中的应用 机器人视觉系统 机器人视觉系统(也称为机器视觉)将传感器和摄像头与机器学习算法结合使用。这些传感器和摄像头采集物理数据,机器学习算法处理这些 阅读全文
posted @ 2024-12-14 12:24 Angry_Panda 阅读(137) 评论(0) 推荐(0)

2024年12月12日

摘要: 相关: 【北京公交】怎样才算一套健全的BRT系统?为何北京的BRT走向沦落?浅谈与介绍快速公交系统及其构成【聊公交-19】 BRT 就是拥有独有路权、专用设施、高效乘降的公交车,因为有这三个特点,因此BRT又不是简单的在公交车系统上的升级,可以说BRT不是公交车但又是公交车,或者说是一种特殊的公交车 阅读全文
posted @ 2024-12-12 11:06 Angry_Panda 阅读(219) 评论(0) 推荐(0)

2024年12月11日

摘要: 奖励景观(机器学习、强化学习) 在强化学习中,Reward Landscape 指的是奖励函数随着状态和行为的变化所形成的空间结构。它可以帮助理解智能体如何通过探索奖励的分布来优化策略。 翻译: 奖励景观;奖励分布图。 例句: The agent learns to navigate the rew 阅读全文
posted @ 2024-12-11 14:16 Angry_Panda 阅读(87) 评论(0) 推荐(0)
摘要: 强化学习算法是人工智能领域发展最为强劲的一个分支,但是很多人都将注意力放在了算法模型的发展上而忽略了其基本理论上的一些概念,本文就讨论一下强化学习算法的一些基本概念的界定上。 来源: https://ai.stackexchange.com/questions/39545/why-is-soft-q 阅读全文
posted @ 2024-12-11 12:00 Angry_Panda 阅读(85) 评论(0) 推荐(0)
摘要: 原文: https://ai.stackexchange.com/questions/39545/why-is-soft-q-learning-not-an-actor-critic-method I've been reading these two papers from Haarnoja et 阅读全文
posted @ 2024-12-11 10:51 Angry_Panda 阅读(45) 评论(0) 推荐(0)
上一页 1 ··· 35 36 37 38 39 40 41 42 43 ··· 269 下一页

导航