摘要: 强化学习落地思考 概括 我对强化学习的实际应用方法进行了分类,主要从两个维度出发:是否存在现成可用的模型以及是否有真实的数据。 基于这两个维度的组合,我将任务分为以下三种情况: 有现成可用的模型,无真实数据 无现成可用的模型,有真实数据 有现成可用的模型,且有真实数据 有现成可用的模型,无真实数据 阅读全文
posted @ 2023-12-04 16:45 戏剧玩家 阅读(144) 评论(0) 推荐(0)
摘要: 题目简述 m个数字,每次选n个数字-1,数字不能小于0,最多能操作多少次。 相同题目. n个大楼,m个电桩,每个电桩右mi个电,要保证每栋大楼都有电,最长能维持多久。 leetcode.2141 我的思路 无 思路 二分答案法,求得T = 总电量/n,然后二分0-T,判断是否坚持t分钟,若可以,就往 阅读全文
posted @ 2022-10-23 23:55 戏剧玩家 阅读(97) 评论(0) 推荐(0)