// // // //

运筹优化与强化学习

运筹优化

强化学习

总览

启发算法 - 汇总篇

优化问题-实战经验

车辆路径规划问题分类

## 优质资源

公众号：运筹优化与学习

原理

差分进化算法

## 遗传算法

遗传算法-总体框架

遗传算法-选择算子

遗传算法-编码

遗传算法-目标函数与适应度函数变换

##

模拟退火算法简介

粒子群算法 PSO【1】- 基本原理

## 蚁群算法

蚁群算法【1】基本原理

蚁群算法【2】优化方法

蚁群算法【3】-论文

拉格朗日松弛

人工蜂群算法（Artificial Bee Colony，ABC）

优化模型建模语言 Pyomo

多目标遗传算法NSGA-II

求解器 Gurobi，Cplex，SCIP，CBC

混合启发算法

代码

大规模邻域搜索 - 代码

自适应大邻域搜索算法 - 代码

变邻域搜索 - 代码

禁忌搜索算法 - 代码

### 排产

基于日历的柔性连续车间排产仿真

柔性车间生产调度问题

物料回流的排产场景

其他

其他启发式算法

【引】智能优化算法汇总

多目标粒子群优化算法原理及其代码实现

在模型优化方面的应用

什么时候使用优化算法优化模型参数而不用梯度下降

遗传算法进行超参数调优

遗传算法进行特征选择

粒子群PSO优化融合注意力机制的卷积神经网络-双向长短期记忆网络(PSO-CNN-BiLSTM-Attention)的多变量预测

周志华西瓜书链接：

DeepLearning/books at master · Mikoto10032/DeepLearning

系列教程一

强化学习3-蒙特卡罗MC

强化学习4-时序差分TD

强化学习6-MC与TD的比较-实战

强化学习7-Sarsa

强化学习8-时序差分控制离线算法Q-Learning

强化学习9-Deep Q Learning

强化学习10-Deep Q Learning-fix target

系列教程二

强化学习 Value based核心知识

强化学习值函数近似Value Function Approximation

强化学习 DQN

Q-learning与DQN算法总结

Value Based 总结

强化学习 Policy Based策略梯度

on/off-policy和on/offline和rollout–generation gap

强化学习 Actor Critic

强化学习 PPO

PPO算法中的actor和critic学习率设置

强化学习 DPO

强化学习 DDPG

LLM强化学习算法演进之路：Q-Learning->DQN->PPO->DPO

强化学习-稀疏奖励问题

RLHF 为什么不对loss 进行梯度下降求解

发表于 2024-11-29 13:13 努力的孔子阅读(293) 评论(0) 收藏举报

刷新页面返回顶部