再探游戏《 2048 》 —— AI方法—— 缘起、缘灭（6） —— Python版本实现的《2048》游戏环境运行性能对比

py2048_1.py代码为移动缓存表方法，其在py2048.py的基础上将所有可能存在的行的移动后状态和所获奖励使用缓存表保存了下来，每一次对棋盘进行移动时部队下次棋盘状态和奖励进行计算而是直接从内存中的缓存表中取出对应行移动后的行和奖励值。与py2048.py最大的不同就是该实现将棋盘变化后的行状态通过预计算的方法保存到了缓存表中，通过对缓存表中数据的读取减少了计算量。但是非常不幸的是通过下面的测试我们知道该种实现并不能提升性能，甚至该版本远不如py2048.py版本。

py2048_2.py代码为移动缓存表改进后的方法。py2048_1.py对移动后的每行计算奖励后对其加和并减去惩罚值才可以得到真正的得分数，在py2048_1.py中每行在一次移动后需要两次循环遍历棋盘状态的各个行，以来读取缓存中移动后的行状态而奖励值，而在py2048_2.py中对移动后行状态及奖励的读取只需要在一次移动后遍历一次棋盘状态的各行即可，减少了对内存的读取。

env_5bits_2048.py 代码为个人设计的缓存表方法，该方法和py2048_1.py类似，都是在每次移动后对棋盘各行进行两次遍历，但与py2048_1.py最大的不同就是这里没有使用list类型来表示棋盘状态而是使用numpy.array，而这个方法也是性能最差的。

对于测试结果个人给出的解释（特指python语言中）：

1. 对于计算量较小的操作，使用预计算的方式缓存起来并不划算，因为对内存读取是要耗费较大时间的，而这个时间有可能已经大于了CPU重新计算这个结果所需的时间；

2. 循环操作是比较耗时的，尤其是频繁的循环操作，如果能降低循环操作的次数（使用for遍历的次数）可以一定程度上减少运算时长；

3. 在数据量较小的情况下，对list类型数据进行按索引读取和相等比较操作的性能要远远优于numpy.array类型。

----------------------------------------------------

测试平台：

Ubuntu22.04系统，i7-10700k CPU 工作频率为5.0Ghz

性能测试：

moporgic原始环境万次游戏的平均用时： 73.3795, 总步数：26108430

移动缓存表方法万次游戏的平均用时： 132.7472, 总步数：26115191
移动缓存表改进后方法万次游戏的平均用时：115.6608, 总步数：26129569
个人设计的缓存表方法万次游戏的平均用时：342.4837, 总步数：25777707

-----------------------------------------------------------------------

posted on 2022-08-13 08:23 Angry_Panda 阅读(284) 评论(0) 收藏举报

刷新页面返回顶部

Angry Panda（T-800）

再探游戏《 2048 》 —— AI方法—— 缘起、缘灭（6） —— Python版本实现的《2048》游戏环境运行性能对比

What is the optimal algorithm for the game 2048?

再探游戏《 2048 》 —— AI方法—— 缘起、缘灭（1） —— Firefox浏览器下自动运行游戏篇

公告

导航

Angry Panda（T-800）

再探 游戏 《 2048 》 —— AI方法—— 缘起、缘灭（6） —— Python版本实现的《2048》游戏环境运行性能对比

What is the optimal algorithm for the game 2048?

再探 游戏 《 2048 》 —— AI方法—— 缘起、缘灭（1） —— Firefox浏览器下自动运行游戏篇

公告

导航

再探游戏《 2048 》 —— AI方法—— 缘起、缘灭（6） —— Python版本实现的《2048》游戏环境运行性能对比

再探游戏《 2048 》 —— AI方法—— 缘起、缘灭（1） —— Firefox浏览器下自动运行游戏篇