人工智能实战第七次作业(个人)——黄金点——邹镇洪16091062

Written by joezou(邹镇洪), 2019/5/12

项目 内容
这个作业属于课程 人工智能实战 2019 - 北京航空航天大学
这个作业的要求在 人工智能实战第七次作业(个人)
我在这个课程的目标是 学会利用云部署机器学习模型并完成一个app
这个作业在这些方面帮助我实现目标 通过黄金点游戏思考AI算法与博弈场景的关联
其他参考文献

作业描述:
1、分析黄金点游戏,给出自己的见解,同时,描述你会采用什么样的策略来玩这个游戏,或者会设计什么样的模型,形成一篇博客。(必做)
2、尝试在房间0或房间1中取得高分(挑战黄金点),并在博客中写明你使用的昵称及参与的日期,会有适当加分。截止到5月12日(周日)晚上,会做一次统计,前几名的小伙伴会有小礼品送出。(选做)

1、分析黄金点游戏
显然,黄金点游戏属于信息充分公开的博弈,并且每一轮的结果与之前的结果无关(尽管玩家可能会参考之前的结果)。理论上,在N个玩家参与的情况下,所有玩家的得分总和每轮增加N-2。在理想情况下每个玩家的最优策略相同,因此我们考虑两种情况(博弈论中达到纳什均衡的两种情形):

  • 纯战略模型(每种情形有确定的决策)
  • 每个玩家“同等聪明”,每次策略为一个确定值的输入:这种情况下每个玩家将输入相同数字,导致黄金点始终小于玩家的输入。在这种情况下,每轮大家得分都为0,系统总和低于游戏期望,因此是零和结果。这种情形对大家都不获利。简而言之,该游戏在达到纳什均衡的情况下对玩家全体无益
  • 每个玩家“不同等聪明”,每次策略为一个确定值的输入:我们不妨先假设有N-1个玩家已经玩了几轮,第N个玩家随后参与。此时可以视前N-1个玩家采取相同的策略,在第k轮都输入xk,那么第N个玩家的期望输入为 $$ xk * \frac{(N - 1)}{(\frac{N}{0.618}- 1)} $$,当N趋于无穷时该期望从右侧趋于xk的0.618倍。假设每个人在下一轮都这么做,那么这N个玩家实质上近似于0.618x1的等比数列,此时黄金点近似于$$x1 * \frac{1 - 0.618^N}{(1-0.618)N}$$,随着N趋于无穷,黄金点从右侧趋于\(\frac{x1}{0.382N}\),即0。当然你可以说:为什么后一个玩家知道的信息总比前一个多?那么我们可以假设玩家的聪明等级是有序的,并且聪明等级对应着考虑的信息量,那么就可以对应地排序,根据选择公理总可以找到一种排序使得玩家的决策有优劣顺序,此时他们的决策结果与上述的有序考虑情形应当一致。(这里我作了“考虑不周”=“根绝部分信息进行决策”的结果假设,可以讨论)
  • 上述分析表明,当大家对于每种情形都给出确定数的决策情形,选择0是最佳的(因为黄金点收敛到0)。但是这样显然会一直失败,因为不能去到黄金点的下确界0。因此实际上应该考虑一个收敛到0的递减数列,比如\(x0*0.5^k(x0为初始值)\)即可。
  • 混合战略模型(每种情形对应一定概率的决策组合)
  • 每个玩家“同等聪明”,每次策略为一个带有概率的决策组合:
  • 每个玩家“不同等聪明”,每次策略为一个带有概率的决策组合:
posted @ 2019-05-12 19:09  joezou  阅读(349)  评论(2编辑  收藏  举报