• 博客园logo
  • 会员
  • 周边
  • 新闻
  • 博问
  • 闪存
  • 众包
  • 赞助商
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
返回主页

X1OO

  • 博客园
  • 首页
  • 新随笔
  • 联系
  • 订阅
  • 管理

Writing - MDP

以下内容是关于把一些组合优化问题建模成马尔可夫决策过程的内容,其中MDP的写作细节值得借鉴。

  • Reinforcement Learning with Combinatorial Actions: An Application to Vehicle Routing, NeurIPS 2020

  • Learning What to Defer for Maximum Independent Sets, ICML 2020

  • LeNSE: Learning To Navigate Subgraph Embeddings for Large-Scale Combinatorial Optimisation, ICML 2022

  • Improving Optimization Bounds Using Machine Learning: Decision Diagrams Meet Deep Reinforcement Learning, AAAI 2019

  • Combining Reinforcement Learning and Constraint Programming for Combinatorial Optimization, AAAI 2021

posted @ 2023-04-25 00:23  X1OO  阅读(18)  评论(0)    收藏  举报
刷新页面返回顶部

公告

博客园  ©  2004-2026
浙公网安备 33010602011771号 浙ICP备2021040463号-3