NO.

核心提示前天,一个酒桌上,大家酒过三巡后,玩起了喝酒游戏。 大体游戏规则是这样的:六个空酒杯,一个骰子,酒桌上的人轮流掷骰子,如果酒杯是空的,就按照自己的意愿往杯中填酒,或半杯,或满杯,或三分之一杯,都可。 如果自己掷的点数刚好是对应的有酒

前天,一个酒桌上,大家酒过三巡后,玩起了喝酒游戏。

大体游戏规则是这样的:六个空酒杯,一个骰子,酒桌上的人轮流掷骰子,如果酒杯是空的,就按照自己的意愿往杯中填酒,或半杯,或满杯,或三分之一杯,都可。

如果自己掷的点数刚好是对应的有酒的杯子,那么,掷色子的人就要把这杯酒喝掉,然后继续掷色子,直到他掷到空杯,按照自己的意愿加了酒以后,才轮到下一人。

刚开始,大家都很矜持,轮到自己,掷到空杯时,都是半杯半杯的加,可几轮过后,大家发现到有些人掷骰子时,突然要求加满杯,再往后的游戏中就再没有加半杯的说法了,到自己这里,为了让别人吃亏,都加满杯酒。

结果,几轮下来,几个哥们在连续喝了三四杯以后,就已经脸色通红,迷迷糊糊了。

第二天,回过神儿来,才明白,大家这种在未知后续游戏如何发展的情况下,都偏好损人不利己,这不就是典型博弈论思维方式——囚徒困境么?

所谓“囚徒困境”是1950年美国兰德公司的艾伯特·塔克(AlbertTucker)以囚徒方式阐述博弈论思维模型,并命名为“囚徒困境”。

讲述两个共谋犯罪的人被关入监狱,不能互相沟通,如果两个人都不揭发对方,则由于证据不足,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确实,二者都判刑八年。由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。最终达到纳什均衡,落在非合作点上的博弈模型。

回到酒桌上的游戏,大家在对其他人并不信任的基础上,都倾向于向杯中加满酒,大家心里清楚,即使轮到自己喝酒,那么下一个人,也是要喝满杯,也不会占到便宜。

而如果有人本轮加了半杯,他并不确定下一个掷骰子喝掉此半杯的人会不会也加半杯,如果他加了满杯,那么再次轮到自己时,自己就吃亏了,因此,最后的赌局一定是大家都眼睁睁的看着酒杯一个个被填满,一杯杯的被喝掉。

一句经典的台词“有些事虽由你开始,却由不得你说结束”。

生活中也是一样,当利益的双方在信息不对称的情况下博弈,最后的结果永远都会向着最糟糕的情况发展,最终两败俱伤。

如何破解囚徒困境?

首先,要以集体理性代替功利计算的个人理性。

其次,加强竞争双方的合作,良性竞争,避免恶性竞争。

最后,坚持道德人和经济人的统一。

下次在酒桌上玩上述喝酒的游戏,不妨在游戏前大家先达成一致意见,总量控制,最多加半杯,谁加满杯其他人就都鄙视他,这样虽说最后都喝了不少,但至少心里会平衡一些。

有个游戏,叫做“ 囚徒困境”

游戏中有两个人,手上分别有两张牌,分别是“合作”牌和“背叛”牌;游戏规则是这样:

双方都打出“合作”牌,则双方都收入300块;

双方都打出“背叛”牌,则双方都罚款10块;

当一方打出“合作”牌,另一方打出“背叛”牌时,“合作”牌的人将罚款100元,“背叛”牌的人将收入500元;

为什么叫“囚徒困境”呢?理论上,只要双方都合作,都可以获得300元,双人的利益是最大化,可是问题是,双方其实是独立个体,也无法沟通,而且即使能沟通,你怎么知道对方会不会骗你。

所以如果对方打出“合作”牌,我为了自己最好的收益应该打出“背叛”牌;如果对方打出“背叛”牌,我减少自己损失也是打出“背叛”牌;也就是说,在这样的博弈之中,最后可能双方会打出“背叛”而面对双输的局面,这就是“囚徒困境”。

有没办法可以跳出这个“囚徒困境”?

在面对一局定胜负的局面,我们可能很难做到。但是我们人生在面对困境不会只有一局的。当你和你发小的博弈,当你和你同学的博弈,当你和伴侣的博弈,我们总会遇到很多次这种应该选择“合作”还是“背叛”的时候,甚至最早我们的祖先就早已面对“合作”还是“背叛”的选择题了。

在面对多局重复的情况,我们则会面对不同的策略;罗伯特·阿克塞尔罗德在《合作的进化》就进行了这个探讨,他利用计算机程序,输入了不同的策略算法:有的策略是每一局都选合作,有的策略是每一局都选背叛;

但有的策略是复杂点,比如我第一次选合作,但是只要遇到对方选一次背叛,我之后会“强烈报复”对他都选背叛;比如我第一次选合作,但是我下局我的选择是“以牙还牙”的和对方上局的出牌一致;还有就是,只要是我背叛而对方是合作的一局,那我下一局就会“内疚”而打出合作;

阿克塞尔罗德进行了两次比赛,把不同的共六十多个策略两两碰对,利用计算机筛选出哪个策略最高分,结果两次都是叫“以牙坏牙”的策略是最高分,也就是我们前面所说的,如果你上局合作,那我下局也会合作,而如果你上局背叛,我下局将会背叛。

这不就和我们现实生活中流行着“ 有恩必报,有仇报仇 ”的现象很一致吗?

有人把“合作为主”看为“ 善 ”,把“背叛为主”看做“ 恶 ”

如果这些善恶的策略进入生存的机制又会怎样呢?于是阿克塞尔罗德把这些策略进行了第三次比赛,而这次比赛不是得分比赛而是“生存”的比赛,而获胜的奖品是自我的复制品。在经历了1000代之后,这些策略的种类和数量慢慢稳定下来,一些“骗子”,“傻瓜”的策略慢慢的的灭绝,活下来的策略,都是“善”的策略为主。

由此我们可以看到:

世界还是会向“善”

善有善报恶有恶报,是人世间的“理”,也是我们人类文化博弈流传下来的“优秀”策略

纯“善”(也就是只会选合作)并不是优秀的策略

不过以上的竞争是基于策略种类丰富而且均衡,各自初始条件平均的基础条件下进行的,而事实上,世界是复杂的。

比如上诉每次都获胜的“以牙还牙”策略,如果遇到周围都是“纯恶”策略(每次背叛)为主的环境,那么“以牙还牙”策略很难获得优势,他第一局就输惨了(以牙还牙的第一局都是选合作),只是后面可以势均力敌。

而被称为“傻子”的“纯善”策略(只会选合作),在“恶”环境为主当然是必死无疑,但是如果在搭上“以牙还牙”这种生存率极高的策略的顺风车,在那1000代之后以“善”为主的策略,这种傻子纯善是能活得很好,这也是“阿甘”我这个时代能被歌颂的原因,但是如果早期的人类社会,可能就没那么好过了。

所以 “环境基础 ”对一个策略的生存也是极为重要,家长为孩子挑选一个良好的环境也是很重要。

当然,人类不会单纯到只有非“善”即“恶”的策略,人性是复杂的,也许会因为环境不同而激发出不同的策略,也许“善”为主的人类只是把“恶”放在隐秘的角落。

但不管怎样,人类至少是总体“ 向善 ”,这是人类长久以来,也许在“智人”时代就已经开始博弈而流传下来的优秀文化,所以我们宣扬“ 爱 ”,宣扬“ 善 ”,惩罚“ 恶 ”,依然需要坚持。

 
友情链接
鄂ICP备19019357号-22