01 2025 档案
摘要:深度强化学习 表格来存储每一个状态state和Q值显然是不现实的,除了存储开销,搜索开销也非常巨大。深度强化学习(Deep Q Network)是强化学习与深度学习的结合,利用神经网络作为函数逼近器来解决高维或复杂状态空间下的强化学习问题。 其关键特征就是使用深度神经网络(DNN)代替表格化的值函数
阅读全文
摘要:强化学习 此笔记作为参考资料的补充,用于记录我在学习过程中不理解的地方。 请优先看西瓜书,里面讲解的更清晰。强烈推荐学习视频:深度强化学习背后的数学原理 强化学习的目标是:通过试错法找到一个最优策略 π,使智能体能够在不同状态下选择动作,从而最大化累积的折扣奖励。 马尔科夫决策 马尔可夫决策过程(M
阅读全文
摘要:如果是比较新的android ndk的版本,建议使用lldb进行调试,参考:vscode lldb远程调试 - OpenFDE - OpenFDE Docs,将lldbserver push到移动端,开启端口调试,配置launch.json即可。 我调试的项目使用的是ndk-r17c,该版本的ndk
阅读全文

浙公网安备 33010602011771号