上一页 1 ··· 6 7 8 9 10 11 下一页
摘要: 给定一个包含 n 个整数的数组 nums,判断 nums 中是否存在三个元素 a,b,c ,使得 a + b + c = 0 ?找出所有满足条件且不重复的三元组。 来源:力扣(LeetCode) 链接:https://leetcode cn.com/problems/3sum 解题思路 双指针 阅读全文
posted @ 2020-01-02 19:40 木子士心王大可 阅读(168) 评论(0) 推荐(0)
摘要: 给定 n 个非负整数 a1,a2,...,an,每个数代表坐标中的一个点 (i, ai) 。在坐标内画 n 条垂直线,垂直线 i 的两个端点分别为 (i, ai) 和 (i, 0)。找出其中的两条线,使得它们与 x 轴共同构成的容器可以容纳最多的水。 链接:https://leetcode cn.c 阅读全文
posted @ 2020-01-01 19:30 木子士心王大可 阅读(160) 评论(0) 推荐(0)
摘要: 给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.' 和 ' ' 的正则表达式匹配。 '.' 匹配任意单个字符 ' ' 匹配零个或多个前面的那一个元素 链接:https://leetcode cn.com/problems/regular expression matching 思路是 阅读全文
posted @ 2020-01-01 18:49 木子士心王大可 阅读(180) 评论(0) 推荐(0)
摘要: [TOC] Chapter1 RL is learning what to do. RL两大特征: trial and error, delayed reward MDP 三个方面:sensation, action, goal RL 认为自己不属于supervised L 和unsupervise 阅读全文
posted @ 2020-01-01 16:58 木子士心王大可 阅读(1122) 评论(0) 推荐(0)
摘要: [TOC] GAN 论文链接 "Generative Adversarial Nets" 问题:数据x分布为 $P_{data}(x)$,有样本{${x_1,x_2,...,x_m}$}。现在我们有生成器 $G$ ,希望生成器 $G$生成这些样本的概率最大。似然是 $L = \sum_{i=1}^{ 阅读全文
posted @ 2020-01-01 16:42 木子士心王大可 阅读(1589) 评论(0) 推荐(0)
摘要: Prioritized Experience Replay: PER 论文地址 "PER" 笔记 PER的基本思路跟传统强化学习里面的Prioritized Sweeping基本一样。就是从replay buffer中sample的时候按照优先级sample,优先级用transition 的TD e 阅读全文
posted @ 2019-12-31 22:22 木子士心王大可 阅读(1288) 评论(0) 推荐(1)
摘要: Dueling Network Architectures for Deep Reinforcement Learning 论文地址 "DuelingDQN" 笔记 基本思路就是$Q(s,a)$的值既和state有关,又和action有关。但是两种"有关"的程度不一样,或者说影响力不一样。 对于$Q 阅读全文
posted @ 2019-12-31 19:27 木子士心王大可 阅读(1141) 评论(0) 推荐(0)
摘要: 给定一个字符串 s,找到 s 中最长的回文子串。你可以假设 s 的最大长度为 1000。 题目: https://leetcode cn.com/problems/longest palindromic substring/submissions/ 写的不好,不容宜写剪枝。太耗时了。 阅读全文
posted @ 2019-12-31 19:00 木子士心王大可 阅读(149) 评论(0) 推荐(0)
摘要: 链接:https://leetcode cn.com/problems/median of two sorted arrays 给定两个大小为 m 和 n 的有序数组 nums1 和 nums2。 请你找出这两个有序数组的中位数,并且要求算法的时间复杂度为 O(log(m + n))。 你可以假设  阅读全文
posted @ 2019-12-31 18:09 木子士心王大可 阅读(143) 评论(0) 推荐(0)
摘要: Deep Recurrent Q Learning for Partially Observable MDPs 论文地址 "DRQN" 笔记 DQN 每一个decision time 需要该时刻前4个frame 来获得完整的状态信息。但是有的游戏四张图片也不能获取完整的状态信息。所以这篇论文就希望使 阅读全文
posted @ 2019-12-31 17:09 木子士心王大可 阅读(1345) 评论(0) 推荐(0)
上一页 1 ··· 6 7 8 9 10 11 下一页