彭斌

[ 2006,2007 ASP.NET ' MVP ]
随笔 - 99, 文章 - 5, 评论 - 986, 引用 - 16
数据加载中……

囚徒困境

在博弈论中有一个基础性的“理想实验”:两个囚徒被分别告知,如果他们揭发对方的犯罪事实,则将得到赦免,如果对方揭发而自己不揭发,则罪加一等,如果双方都保持沉默,则依据现有罪行得到惩罚。姑且把赦免看做获得收益+1,罪加一等是获得收益-10,现有罪行的惩罚为-4,则“如果囚徒都是理性人,他们将如何选择?”
囚徒A:如果对方揭发而我不揭发,则我的收益为-10;如果对方揭发而我也揭发,则我的收益为-9。故揭发比不揭发好。
如果对方不揭发而我也不揭发,则我的收益为-4;如果对方不揭发而我揭发,则我的收益为+1。故揭发也比不揭发好。
囚徒B:同囚徒A。
故囚徒都采取了揭发的策略。
 
如果从群体利益最大化的角度,这是一个最不经济的选择,共收益-18。群体最好的做法是什么呢,就是都咬定不松口,那样群体的总收益是-8。这就是所谓的“囚徒困境”。
可见,个人的理性选择并不一定带来群体利益的最大化。这里面蕴含着一些极有趣的推论,在实际的工作中很有用处。

posted on 2005-12-28 09:15 彭斌 阅读(304) 评论(3)  编辑 收藏 所属分类: 生活随笔

评论

#1楼    回复  引用    

所以曹孟德說,寧教我負天下人,休教天下人負我。
因為如此可獲得最大利益。
2006-01-02 16:05 | 晴樹 [未注册用户]

#2楼    回复  引用    

赦免为啥才+1呢?加14的话,都揭发不就双赢?
关键对于囚徒:受益>=0就是胜利,受益>>0又有啥意义?
2006-01-30 07:28 | 贾博 [未注册用户]

#3楼    回复  引用  查看    

说不清楚!
2006-06-29 17:16 | 天轰穿      

标题  
姓名  
主页
Email (博主才能看到) 
验证码 *  看不清,换一张 [登录][注册]
内容(请不要发表任何与政治相关的内容)  
  登录  使用高级评论  新用户注册  返回页首  恢复上次提交      
该文被作者在 2006-01-06 19:55 编辑过


相关链接: