木子士心王大可

2020年1月2日

摘要：给定一个包含 n 个整数的数组 nums，判断 nums 中是否存在三个元素 a，b，c ，使得 a + b + c = 0 ？找出所有满足条件且不重复的三元组。来源：力扣（LeetCode）链接：https://leetcode cn.com/problems/3sum 解题思路双指针阅读全文

posted @ 2020-01-02 19:40 木子士心王大可阅读(168) 评论(0) 推荐(0)

2020年1月1日

leetcode(7)-盛最多水的容器

摘要：给定 n 个非负整数 a1，a2，...，an，每个数代表坐标中的一个点 (i, ai) 。在坐标内画 n 条垂直线，垂直线 i 的两个端点分别为 (i, ai) 和 (i, 0)。找出其中的两条线，使得它们与 x 轴共同构成的容器可以容纳最多的水。链接：https://leetcode cn.c 阅读全文

posted @ 2020-01-01 19:30 木子士心王大可阅读(160) 评论(0) 推荐(0)

leetcode(6)- 正则表达式匹配

摘要：给你一个字符串 s 和一个字符规律 p，请你来实现一个支持 '.' 和 ' ' 的正则表达式匹配。 '.' 匹配任意单个字符 ' ' 匹配零个或多个前面的那一个元素链接：https://leetcode cn.com/problems/regular expression matching 思路是阅读全文

posted @ 2020-01-01 18:49 木子士心王大可阅读(180) 评论(0) 推荐(0)

《强化学习导论》读书笔记

摘要： [TOC] Chapter1 RL is learning what to do. RL两大特征： trial and error, delayed reward MDP 三个方面：sensation, action, goal RL 认为自己不属于supervised L 和unsupervise 阅读全文

posted @ 2020-01-01 16:58 木子士心王大可阅读(1122) 评论(0) 推荐(0)

GAN 论文阅读笔记

摘要： [TOC] GAN 论文链接 "Generative Adversarial Nets" 问题:数据x分布为 $P_{data}(x)$,有样本{${x_1,x_2,...,x_m}$}。现在我们有生成器 $G$ ，希望生成器 $G$生成这些样本的概率最大。似然是 $L = \sum_{i=1}^{ 阅读全文

posted @ 2020-01-01 16:42 木子士心王大可阅读(1589) 评论(0) 推荐(0)

2019年12月31日

[强化学习论文笔记(5)]:PER

摘要： Prioritized Experience Replay: PER 论文地址 "PER" 笔记 PER的基本思路跟传统强化学习里面的Prioritized Sweeping基本一样。就是从replay buffer中sample的时候按照优先级sample,优先级用transition 的TD e 阅读全文

posted @ 2019-12-31 22:22 木子士心王大可阅读(1288) 评论(0) 推荐(1)

[强化学习论文笔记(4)]:DuelingDQN

摘要： Dueling Network Architectures for Deep Reinforcement Learning 论文地址 "DuelingDQN" 笔记基本思路就是$Q(s,a)$的值既和state有关，又和action有关。但是两种"有关"的程度不一样，或者说影响力不一样。对于$Q 阅读全文

posted @ 2019-12-31 19:27 木子士心王大可阅读(1141) 评论(0) 推荐(0)

leetcode(5)-最长回文子串

摘要：给定一个字符串 s，找到 s 中最长的回文子串。你可以假设 s 的最大长度为 1000。题目: https://leetcode cn.com/problems/longest palindromic substring/submissions/ 写的不好,不容宜写剪枝。太耗时了。阅读全文

posted @ 2019-12-31 19:00 木子士心王大可阅读(149) 评论(0) 推荐(0)

leetcode(4)-寻找两个有序数组的中位数

摘要：链接：https://leetcode cn.com/problems/median of two sorted arrays 给定两个大小为 m 和 n 的有序数组 nums1 和 nums2。请你找出这两个有序数组的中位数，并且要求算法的时间复杂度为 O(log(m + n))。你可以假设阅读全文

posted @ 2019-12-31 18:09 木子士心王大可阅读(143) 评论(0) 推荐(0)

[强化学习论文笔记(3)]:DRQN

摘要： Deep Recurrent Q Learning for Partially Observable MDPs 论文地址 "DRQN" 笔记 DQN 每一个decision time 需要该时刻前４个frame 来获得完整的状态信息。但是有的游戏四张图片也不能获取完整的状态信息。所以这篇论文就希望使阅读全文

posted @ 2019-12-31 17:09 木子士心王大可阅读(1345) 评论(0) 推荐(0)

李志琦的博客

公告