上一页 1 ··· 23 24 25 26 27 28 29 30 31 ··· 269 下一页

2025年2月27日

摘要: 原地址: https://www.jiemian.com/article/2285925.html 今天,OpenAI宣布他们的AI仅通过一次人类演示,就在蒙特祖玛的复仇游戏中获得了74500分的成绩,比以往公布的任何结果都要好。 《蒙特祖玛的复仇》(Montezuma’s Revenge)被认为是 阅读全文
posted @ 2025-02-27 10:14 Angry_Panda 阅读(37) 评论(0) 推荐(0)
摘要: 前文地址: https://www.cnblogs.com/xyz/p/18707896 说下我个人的一些观点。 我认为: 数学意义上的等价并不是机器学习算法中的优先考虑的选项。虽然机器学习或者说AI是和数学领域难以割舍开的,但是机器学习和AI并不是数学,二者并不等价,或者说数学领域的评判标准和机器 阅读全文
posted @ 2025-02-27 08:24 Angry_Panda 阅读(52) 评论(0) 推荐(0)

2025年2月26日

摘要: 相关: https://live.csdn.net/room/csdnnews/v7C2xKRI 阅读全文
posted @ 2025-02-26 17:30 Angry_Panda 阅读(182) 评论(0) 推荐(0)

2025年2月25日

摘要: 相关: 研三女生烧炭自杀!疑因数据被导师给别人,毕业无望……87岁爷爷得知噩耗后突发脑溢血 阅读全文
posted @ 2025-02-25 13:13 Angry_Panda 阅读(19) 评论(0) 推荐(0)

2025年2月24日

摘要: 原文地址: https://www.163.com/dy/article/DND62JQS0511ABV6.html 来源:medium 作者:Arthur Juliani 编译:肖琴 《蒙特祖玛的复仇》是一个出了名困难的游戏,是强化学习的一大挑战。本文作者长期从事深度强化学习研究,他认为DeepM 阅读全文
posted @ 2025-02-24 21:04 Angry_Panda 阅读(54) 评论(0) 推荐(0)

2025年2月20日

摘要: Welcome Message & Instructions Thank you very much for accepting to be a Reviewer for IJCNN 2025. Your contribution is essential for building a qualit 阅读全文
posted @ 2025-02-20 23:59 Angry_Panda 阅读(213) 评论(0) 推荐(0)

2025年2月15日

摘要: https://www.douyin.com/video/7356084340859735335 阅读全文
posted @ 2025-02-15 11:20 Angry_Panda 阅读(21) 评论(0) 推荐(0)

2025年2月13日

摘要: 地址: https://www.youtube.com/watch?v=kyA6uJxIdNY 阅读全文
posted @ 2025-02-13 13:14 Angry_Panda 阅读(32) 评论(0) 推荐(0)

2025年2月10日

摘要: "deepseek面试被问懵了: DPO为什么用KL散度,不用交叉熵? 机器学习中什么时候必须用KL散度,什么时候必须用交叉熵,什么时候二者可互换?" 一位专注于算法的面试者向极速财讯分享了自己的经验,他主要从事TensorFlow/PyTorch相关的工作,涉及各种模型结构、复杂度以及分布式训练。 阅读全文
posted @ 2025-02-10 15:03 Angry_Panda 阅读(843) 评论(0) 推荐(0)
摘要: torch.nn.init.calculate_gain 是 PyTorch 提供的一个辅助函数,用于计算初始化权重时的 增益因子(gain factor)。它的作用是根据不同的激活函数类型调整权重的方差,使其更适合训练,避免梯度消失或爆炸问题。 nn.init.calculate_gain 对于不 阅读全文
posted @ 2025-02-10 12:17 Angry_Panda 阅读(110) 评论(0) 推荐(0)
上一页 1 ··· 23 24 25 26 27 28 29 30 31 ··· 269 下一页

导航