摘要: ```python class Solution: ''' 倍增divisor,每次将结果保存到divisor_multiadd_list, divisor_multiadd_list[k]=2^k * divisor ''' def divide(self, dividend: int, divisor: int) -> int: #溢出处理 if dividend 2**31 and divi 阅读全文
posted @ 2019-12-04 13:03 benda 阅读(82) 评论(0) 推荐(0) 编辑
摘要: ```python class Solution: def strStr(self, haystack: str, needle: str) -> int: def kmp_nextval(needle): nextval=[] i,j=0,-1 nextval.append(j) while len(nextval)<len(needle): if j 1 or needle[i]==needl 阅读全文
posted @ 2019-12-04 12:51 benda 阅读(90) 评论(0) 推荐(0) 编辑
摘要: 时间 20191125 20191201 2019年秋季学期第12周 工作内容 和老师meeting确定论文大致内容和方向,初步完成研究目的,和框架描述,开始写论文 调研强化学习内容 阅读全文
posted @ 2019-12-01 21:19 benda 阅读(100) 评论(0) 推荐(0) 编辑
摘要: 本章假设环境是一个有限的MDP,且概率分布由$p(s',r|s,a)$给出 $$ \begin{aligned} v_ (S)&=\mathop{\max}_ {\pi} v_\pi(s)=\mathop{\max}_ {a} E_{\pi_ }[G_t|S_t=s,A_t=a]\\ &=\math 阅读全文
posted @ 2019-11-07 15:39 benda 阅读(374) 评论(0) 推荐(0) 编辑
摘要: 有限马尔可夫MDP是序列决策的经典形式化表达,其动作不仅影响当前的即时收益,还影响后续的状态,以及未来的收益。【即时收益和延迟收益之间权衡的需求】 3.1 智能体 环境 交互接口 智能体【agent】:进行学习及实施决策的机器 环境【environment】:智能体之外所有能与其相互作用的实物 通过 阅读全文
posted @ 2019-11-06 13:56 benda 阅读(613) 评论(0) 推荐(0) 编辑
摘要: 1. 问题描述 重复在k个选项或动作中进行选择,每次做出选择后,你都会得到一个收益,收益由你选择的动作决定的平稳概率分布产生【action P(val)】,你的目标是在某段时间内最大化总收益的期望 1.1 基本符号定义 $A_t$:t时刻选择的动作 $R_t:A_t$对应的收益 $q_ (a)$:任 阅读全文
posted @ 2019-10-27 16:41 benda 阅读(442) 评论(0) 推荐(0) 编辑
摘要: 1. 基本介绍 1.1 基本思想 智能体为了实现目标而不断与环境产生交互的过程中,抓住智能体所面对的真实问题的主要方面。具备学习能力的智能体必须在某种程度上感知环境的状态,然后采取动作并影响环境状态,智能体必须同时拥有和环境状态有关的一个或多个明确的目标。 1.2 关键特征 试探与开发的这种权衡 明 阅读全文
posted @ 2019-10-27 16:40 benda 阅读(338) 评论(0) 推荐(0) 编辑
摘要: 变分自动编码器(VAE)用于生成模型,结合了深度模型以及静态推理。简单来说就是通过映射学习将一个高维数据,例如一幅图片映射到低维空间Z。与标准自动编码器不同的是,X和Z是随机变量。所以可以这么理解,尝试从P(X|Z)中去采样出x,所以利用这个可以生成人脸,数字以及语句的生成。 1.模型 以上为模型的 阅读全文
posted @ 2019-10-17 14:57 benda 阅读(1411) 评论(0) 推荐(0) 编辑
摘要: 从前往后遍历,遍历到i位置,查询target nums[i]是否已经遍历到过。 python版本 阅读全文
posted @ 2019-10-11 14:20 benda 阅读(91) 评论(0) 推荐(0) 编辑
摘要: https://vjudge.net/problem/HYSBZ 1079 cpp include using namespace std; long long int C[100][100] = {}, A[20][100] = {}; const long long int mod = 1e9 阅读全文
posted @ 2019-06-01 10:21 benda 阅读(147) 评论(0) 推荐(0) 编辑