摘要: Finite-time Analysis of the Multiarmed Bandit Problem Abstract Reinforcement learning policies face the exploration versus exploitation dilemma, i.e. 阅读全文
posted @ 2023-09-16 11:01 藤君 阅读(60) 评论(0) 推荐(0) 编辑
摘要: 9.16凌晨 新学期也算是步入正轨了,各科作业都开始进行,大项目小组都建好了,凸优化和人工智能导论开始折磨人,学校开始组织一系列活动、比赛...... 感觉最担心的是,自己认识到大一学年参加的活动太少,现在焦虑于此,最后不但课余活动没顾好,课内知识掌握水平还下滑了。这是极有可能发生的。 解决的办法是 阅读全文
posted @ 2023-09-16 00:26 藤君 阅读(33) 评论(0) 推荐(1) 编辑