会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
李志琦的博客
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
6
7
8
9
10
11
下一页
2020年1月2日
leetcode(8)-三数之和
摘要: 给定一个包含 n 个整数的数组 nums,判断 nums 中是否存在三个元素 a,b,c ,使得 a + b + c = 0 ?找出所有满足条件且不重复的三元组。 来源:力扣(LeetCode) 链接:https://leetcode cn.com/problems/3sum 解题思路 双指针
阅读全文
posted @ 2020-01-02 19:40 木子士心王大可
阅读(168)
评论(0)
推荐(0)
2020年1月1日
leetcode(7)-盛最多水的容器
摘要: 给定 n 个非负整数 a1,a2,...,an,每个数代表坐标中的一个点 (i, ai) 。在坐标内画 n 条垂直线,垂直线 i 的两个端点分别为 (i, ai) 和 (i, 0)。找出其中的两条线,使得它们与 x 轴共同构成的容器可以容纳最多的水。 链接:https://leetcode cn.c
阅读全文
posted @ 2020-01-01 19:30 木子士心王大可
阅读(160)
评论(0)
推荐(0)
leetcode(6)- 正则表达式匹配
摘要: 给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.' 和 ' ' 的正则表达式匹配。 '.' 匹配任意单个字符 ' ' 匹配零个或多个前面的那一个元素 链接:https://leetcode cn.com/problems/regular expression matching 思路是
阅读全文
posted @ 2020-01-01 18:49 木子士心王大可
阅读(180)
评论(0)
推荐(0)
《强化学习导论》读书笔记
摘要: [TOC] Chapter1 RL is learning what to do. RL两大特征: trial and error, delayed reward MDP 三个方面:sensation, action, goal RL 认为自己不属于supervised L 和unsupervise
阅读全文
posted @ 2020-01-01 16:58 木子士心王大可
阅读(1122)
评论(0)
推荐(0)
GAN 论文阅读笔记
摘要: [TOC] GAN 论文链接 "Generative Adversarial Nets" 问题:数据x分布为 $P_{data}(x)$,有样本{${x_1,x_2,...,x_m}$}。现在我们有生成器 $G$ ,希望生成器 $G$生成这些样本的概率最大。似然是 $L = \sum_{i=1}^{
阅读全文
posted @ 2020-01-01 16:42 木子士心王大可
阅读(1589)
评论(0)
推荐(0)
2019年12月31日
[强化学习论文笔记(5)]:PER
摘要: Prioritized Experience Replay: PER 论文地址 "PER" 笔记 PER的基本思路跟传统强化学习里面的Prioritized Sweeping基本一样。就是从replay buffer中sample的时候按照优先级sample,优先级用transition 的TD e
阅读全文
posted @ 2019-12-31 22:22 木子士心王大可
阅读(1288)
评论(0)
推荐(1)
[强化学习论文笔记(4)]:DuelingDQN
摘要: Dueling Network Architectures for Deep Reinforcement Learning 论文地址 "DuelingDQN" 笔记 基本思路就是$Q(s,a)$的值既和state有关,又和action有关。但是两种"有关"的程度不一样,或者说影响力不一样。 对于$Q
阅读全文
posted @ 2019-12-31 19:27 木子士心王大可
阅读(1141)
评论(0)
推荐(0)
leetcode(5)-最长回文子串
摘要: 给定一个字符串 s,找到 s 中最长的回文子串。你可以假设 s 的最大长度为 1000。 题目: https://leetcode cn.com/problems/longest palindromic substring/submissions/ 写的不好,不容宜写剪枝。太耗时了。
阅读全文
posted @ 2019-12-31 19:00 木子士心王大可
阅读(149)
评论(0)
推荐(0)
leetcode(4)-寻找两个有序数组的中位数
摘要: 链接:https://leetcode cn.com/problems/median of two sorted arrays 给定两个大小为 m 和 n 的有序数组 nums1 和 nums2。 请你找出这两个有序数组的中位数,并且要求算法的时间复杂度为 O(log(m + n))。 你可以假设
阅读全文
posted @ 2019-12-31 18:09 木子士心王大可
阅读(143)
评论(0)
推荐(0)
[强化学习论文笔记(3)]:DRQN
摘要: Deep Recurrent Q Learning for Partially Observable MDPs 论文地址 "DRQN" 笔记 DQN 每一个decision time 需要该时刻前4个frame 来获得完整的状态信息。但是有的游戏四张图片也不能获取完整的状态信息。所以这篇论文就希望使
阅读全文
posted @ 2019-12-31 17:09 木子士心王大可
阅读(1345)
评论(0)
推荐(0)
上一页
1
···
6
7
8
9
10
11
下一页
公告