一报还一报
近读《合作的进化》,读完了前两章,做一个总结。
书中简化的囚徒困境如下:
| B合作 | B背叛 | |
| A合作 | A3B3 | A0B5 |
| A背叛 | A5B0 | A1B1 |
AIBJ:A可以的I分,B可以得J分。
困境就在于:如果个体理性的话,若对方背叛,则应该选择背叛,至少能得1分;若对方合作,则还应该选择背叛,应为能得5分。然而,对方也这么想的话,大家都会选择背叛,结果大家的得分都很低为1分。若大家都理性的话应该选择都合作,这样大家的收益总和是最高的。这就是所谓的“困境”:个体理性和双方理性的困境。
在重复囚徒困境实验中中面对所有情况表现最好的策略是一报还一报。
该策略可描述如下:
1.永远不先进行背叛(第一步进行合作)
2.总在下一步时模仿对方上一次的行为(合作则继续合作,背叛则以背叛进行报复)
这个策略看上去十分简单,但在许多计算机程序的轮番测试中所得的成绩总是第一。
也有其他几个有意思的策略,不过综合起来他们的成绩不如一报还一报。
有一个狡诈的策略看起来很有意思:它看上去就像一报还一报,但是它会在10次博弈中随机的选取一次(在对方合作后)进行背叛。这招可以叫偷吃小便宜。但是它的成绩却很差。这是因为它没有考虑到背叛的惩罚,即报复,一旦它碰到具有报复性的策略,最后会导致两败俱伤,即最后双方都进行背叛,导致游戏得分降低,虽然它可能对某个策略会占到一些小便宜,但是在整体来说,它的总得分是较低的。
所以同理,一旦有许多具有报复性策略时,一直选择背叛的策略的总得分也会很低。
作者总结的制胜原因有以下几点:
1.这个策略具有善良性(从不进行主动背叛,容易获得善良型策略的好感)
2.这个策略具有报复性(在被对方背叛后立刻背叛实施报复,可以不让狡猾的策略占太多便宜)
3.这个策略具有宽容性(不记仇,仅在对方背叛后一次内实施报复,尽量促进合作的发生)
对我的一点启示是:不占小便宜,对恶劣行为要进行立刻报复(惩罚),但不应该记仇。
浙公网安备 33010602011771号