2025年11月5日
摘要: 多臂机被应用的两种视角:一种是变元视角——将n个变元当作n个臂,选出决策变元;另一种是策略视角——将VSIDS、CHB、LRB、DIST等4个不同的决策策略当作4个臂;每种策略举荐值来PK,选出决策变元; 学习文献来源: 1. Combining VSIDS and CHB Using Restar 阅读全文
posted @ 2025-11-05 16:39 海阔凭鱼跃越 阅读(13) 评论(0) 推荐(0)