会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
芋圆院长
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
8
9
10
11
12
13
14
15
16
17
下一页
2021年12月29日
最优化方法课程总结二 --- 优化问题求解概述
摘要: 本篇是对自己学习《最优化方法》的一些脉络、思路的记载,夹杂自己的一点点思考。 之前讲到求函数的局部最优,凸函数则为全局最优的基本判别条件(参见之前的最优化方法课程总结一)。知道基本原理后,自然要实际操作计算。本篇主要是对解决思路的概述和一些方法的介绍 优化问题的求解概述 一般求解方法有解析法、图解法
阅读全文
posted @ 2021-12-29 11:26 芋圆院长
阅读(703)
评论(0)
推荐(0)
2021年11月26日
重采样(Resampling)
摘要: 重采样 重采样的主要方法有残差重采样、多项式重采样、最优重采样、分层重采样和最优传输重采样等。 (说实话我还没搞清楚和信号处理那边差不多的上下重采样之类之间的关系) 这篇文章介绍的重采样是针对之前提到的蒙特卡罗序列采样时为了避免重要性权重过大导致小部分粒子占据大部分权重,选择用粒子数目来表示比例的一
阅读全文
posted @ 2021-11-26 20:30 芋圆院长
阅读(4086)
评论(0)
推荐(0)
2021年11月24日
序列蒙特卡罗(Sequential Monte Carlo)
摘要: 发现网上看到的序列蒙特卡罗的中文理解很少,就稍微整理一下自己看到的,欢迎讨论~ 内容引入 许多现实世界的数据分析任务都涉及从一些给定的观察数据中估计预测未知的数据。大多数应用场景下可以使用一些先验知识来辅助建模,即贝叶斯模型【通过未知量的先验分布以及与这些量与观测值相关的似然函数得到后验分布来刻画和
阅读全文
posted @ 2021-11-24 21:00 芋圆院长
阅读(3440)
评论(3)
推荐(0)
2021年11月15日
强化学习之基于函数逼近的同轨策略预测(三)-- 线性方法及其特征构造
摘要: 注:本节内容是对Sutton的《Reinforcement Learning: An introduction》第九章的理解整理~ 这里是第四、五节 上节讲到使用函数逼近状态值时使用的优化方法,随机梯度法可以用来求解各种函数最值。最简单的莫过于**线性关系!**近似函数是权值向量$w$的线性函数。
阅读全文
posted @ 2021-11-15 15:32 芋圆院长
阅读(230)
评论(0)
推荐(0)
2021年11月10日
最优化方法课程总结一 --- 凸规划与无约束规划
摘要: 本篇是对自己学习《最优化方法》的一些脉络、思路的记载,也有可能会有一点点思考。 贯穿本学期课程的主要内容实际上是泰勒公式和线性系统的择一性。当然主要是因为线性情况比较好求解,且任何函数取局部都可以线性近似,解决线性问题具有一般意义。 泰勒公式 一般来讲 ,泰勒公式展开只需要用到二阶即可。其本质意义在
阅读全文
posted @ 2021-11-10 22:07 芋圆院长
阅读(1626)
评论(0)
推荐(0)
2021年11月8日
图搜索算法
摘要: 很多游戏、实际问题等的结构都和图有关,在图结构中寻找最优解也就是在图结构中进行搜索。有搜索自然就有广度优先、深度优先和启发式搜索三种方式。 广度优先 顾名思义,先从广度开始:检查完一个结点的全部后继结点才会开始搜索新的结点的后继结点。在实际实施过程中,经常使用队列结构来存储访问结点(先进先出) 一般
阅读全文
posted @ 2021-11-08 20:29 芋圆院长
阅读(435)
评论(0)
推荐(0)
2021年11月3日
强化学习之基于函数逼近的同轨策略预测(二)-- 随机梯度和半梯度方法
摘要: 注:本节内容是对Sutton的《Reinforcement Learning:An Introduction》第九章的理解整理~ 这里是第三节 回顾之前所说,我们希望能够找到比较好的函数参数使得逼近效果尽可能地好(给出了状态重要性分布),接下来这一节讨论的是可以使用什么方法来逼近呢? **一定要记住
阅读全文
posted @ 2021-11-03 20:44 芋圆院长
阅读(297)
评论(0)
推荐(0)
强化学习之基于函数逼近的同轨策略预测(一)-- 价值函数逼近和预测目标
摘要: 注:本节内容是对Sutton的《Reinforcement Learning:An Introduction》第九章的理解整理~ 这里是第一、二节 我们知道 强化学习主要是通过对状态或动作状态组的值函数估计来进行决策。在之前的讨论中,每个状态的状态值函数只受前继、后继状态的影响,一次更新只影响一个状
阅读全文
posted @ 2021-11-03 14:59 芋圆院长
阅读(406)
评论(0)
推荐(0)
2021年10月15日
Python数据处理函数汇总【numpy】
摘要: 注:本文是对使用Python进行数据处理时常用的函数进行总结。 array的一些简单用法(再也不想用一次查一次了) 排序及索引 import numpy as np a = np.arange(100) b = sorted(a) a.sort() # 上述b是对a排序之后的新数组,a对象直接调用s
阅读全文
posted @ 2021-10-15 16:51 芋圆院长
阅读(165)
评论(0)
推荐(0)
2021年10月12日
使用matplotlib画图知识点汇总
摘要: 本节是在画图过程中不断【百度】得到的经验汇总,主要是为了自己以后少查几次-_- subplot 和 bar 该函数主要是用来划分画布块的,一般想要在一个页面中画多幅图时使用。 具体使用步骤如下: import matplotlib.pyplot as plt import numpy as np p
阅读全文
posted @ 2021-10-12 22:01 芋圆院长
阅读(116)
评论(0)
推荐(0)
上一页
1
···
8
9
10
11
12
13
14
15
16
17
下一页
公告