在剪刀石头布中死掉的女孩,真的自私吗?

作者:汪婕舒 | Jieshu Wang

江湖上流传着一个传说。说,一对恋人,高中就相识,彼此十分相爱,大学去了美国,在那里遇到了一个专杀情侣的变态杀人狂。他们俩不幸被抓起来,绑在了一台杀人机器上。生还的办法是玩剪刀石头布,胜方生存,败方被腰斩,平局两人同死。他们决定一同出石头,一起赴死。结果,女孩死了。因为男孩出了剪刀,女孩出了布。

分析这个故事,第一反应是:女孩太自私,说好了出石头,她一定是为了活下去才出布。没想到啊没想到,深爱着对方的男孩为了让女孩活下去,牺牲自己,出了剪刀。结果,女孩却出乎意料的输了。No zuo no die why you try?没安好心,一定不会有好下场;而内心充满爱,一定会获得幸福——正符合朴素的轮回观念。

再仔细一想,还可以有其他解读啊。

比如说:相识多年,女孩一定很了解男孩。平时,男孩虽然经常嘴上说“不准吃冰淇淋哦”,但还是会为她买回来一堆可爱多,好贴心么么哒。所以,她知道,在这样的紧急关头,他一定会让她活着,所以他会出剪刀让她赢。而她也拥有一颗圣母般纯洁滴内心,为了让恋人活下去,她可以牺牲自己,因此她出了布。从这个角度分析,两人都无私得叫人内牛满面。

再比如说:男孩很了解女孩,知道她是一个自私的人。她平时就以自我为中心,从不考虑别人。所以,他知道,为了让她自己活下去,女孩一定会出布。男孩不甘心为这样一个女人放弃生命,他要活下去,所以他出了剪刀。从这个角度分析,两人都很腹黑。

说到这里,你是不是已经晕菜了。没关系,下面我们来讲一个《甄嬛传》的故事,同样很晕菜。

话说《甄嬛传》第74集,甄嬛与果郡王的耐情已经让绿帽子皇帝已经看不下去了,所以他要甄嬛用毒酒亲手杀死果郡王。甄嬛悲痛欲绝,欲自行了断,于是把两人的酒壶换了一下,给自己的是毒酒,留给果郡王的是无毒酒。果郡王看出她的是毒酒,又悄悄把酒换回来,饮毒殉情。

电视剧《甄嬛传》第74集截图

其实还有另一种解读:甄嬛娘娘是一个运筹帷幄、不动声色的高级后宫玩家,她对果郡王非常了解,她很可能知道果郡王为了她会喝下毒酒,所以,她特意先给自己倒上毒酒,并表现出要自杀的样子……

为什么同一件事情会有这么多解读?这是因为,有的信息是“公共知识”(比如游戏规则),有的信息不是(一个玩家了解另一个玩家,而另一个玩家不了解对方或者不知道对方如此了解自己)。我们人为地创造出了一些“不完全信息博弈”。

而在“完全信息博弈”中,所有的信息都是“公共知识”,玩家对对方在各种情况下的策略和获益都完全了解。

举一个著名的栗子叫做“囚徒困境”。考虑某天下午,你和小明一起去踢球,把教室的玻璃窗砸碎了。老师觉得平常调皮捣蛋的你俩最有嫌疑,但是缺乏足够的证据,所以把你俩分别逮到两个办公室进行审问。老师说,如果你俩都抵赖,那就每人抄一遍《离骚》,作为乱踢球的惩罚。如果两人都坦白,那每人抄八遍《离骚》,作为砸碎玻璃的惩罚。如果一人坦白,另一人抵赖,那坦白的那个不用抄课文,抵赖的那个抄十遍。

你心想:“抄十遍《离骚》呐!太不人道了啊!”

于是你开始思考,如果小明坦白了,那么:你坦白,抄八遍;你抵赖,抄十遍,坦白划算。如果小明抵赖了,那么:你坦白,不用抄;你抵赖,抄一遍,还是坦白划算。这么看来,不管小明坦白还是抵赖,你都是坦白划算。所以,你坦白了。

小明和你的想法一样,他也坦白了。于是,你俩都抄了八遍《离骚》。路漫漫其修远兮,吾将上下而抄写……

可是,你不觉得这故事有点不对劲吗?如果两人同时抵赖,每人只用抄一遍诶。为什么最后大家都坦白了呢?因为你们都陷入了“囚徒困境”——对个人最优的策略,却导致了集体的非理性。

那么,博弈论到底是什么呢?

简单来说,博弈论就是一门玩游戏的理论,英文就叫Game Theory。它研究个体在具有一定规则的游戏中的行为以及优化策略。它是经济学的分析工具,生物学家也用它来理解和预测进化论。

要了解博弈论,我们必须了解一个伟大的数学家——约翰•纳什(John Forbes Nash)。不知你是否看过一部感人至深的电影《美丽心灵》,这部电影的主角就是纳什。他的一生都在同精神分裂症带来的幻听和幻觉作斗争。1950年代,他的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的“纳什均衡”。为此,他获得了1994年的诺贝尔经济学奖。

约翰•纳什 图/Wikipedia

所谓“纳什均衡”,是一种策略组合,使每个参与者的策略都是对其他参与者策略的最优反应。上面所说的“囚徒困境”,就是一个典型的纳什均衡。虽然你俩都被迫抄了八遍《离骚》,但是我懂,你也没办法,换一个人也一样。

你一定很难过,难道就无解了吗?实在不想抄啊!没关系,我们扩展一下这个模型的时间,也许就有解了。

抄《离骚》的故事中,你和小明只被询问了一轮,因此这是一个静态的博弈。实际上,在日常生活中,我们每天都在观察别人,再根据别人的策略来对自己的策略做出调整,这叫做动态博弈。

那么,我们就来看一个动态博弈的小故事:红帽子与白帽子。

在一个监狱里关押着100个死刑犯。有一天,监狱长大发慈悲,决定给他们生存的机会。他让这些死刑犯每人戴上一顶帽子,其中有97顶白帽子和3顶红帽子。囚犯可以看到别人的帽子,但是看不到也不能偷看自己的帽子,更不能和别人说话。

他宣布:

  1. 每天晚上,囚犯可以选择当众猜出自己帽子的颜色。猜对了就无罪释放,猜错了就立刻杀头。当然,你也可以选择沉默,这样你就一直被关押着。
  2. 至少有一顶红帽子。

请问,有人能猜出来吗?第几天会有人猜出来呢?有多少人能猜出来呢?

当然,我们首先要假设,不会有人瞎猜,因为这可是要杀头滴。

接下来,我们可以设红帽子的个数为n。

假设n=1,那么唯一的红帽子会看见99顶白帽子。监狱长说过“至少有一顶红帽子”,那么他立刻会知道自己是红帽子,于是,第一天晚上,他就会去猜自己的颜色。

如果第一天没有人猜,说明假设“n=1”不成立,所以n≥2,这个信息在第二天早上变成“公共知识”。这时,如果有人看见1顶红帽子和98顶白帽子,他就会知道自己是红帽子,那么,这天晚上,他就会去猜自己的颜色。

同理,如果第二天还没人猜,那么“n≥3”就会变成“公共知识”,这时看见两顶红帽子的人就会知道自己是红帽子。那么,这天晚上,他就会去猜自己的颜色。

以此类推,我们可以得出,如果第m天没人猜,那么所有看见m顶红帽子的人就知道自己是红帽子,也就是“n=m+1”。第二天,也就是第m+1天,他们就应该去猜自己是红帽子。

第m+2天,“n=m+1”变成公共知识。剩下的所有人,都知道自己是白帽子。因此当天晚上,他们都会去猜自己是白帽子,所有死刑犯都将被释放。(监狱长会哭死吧)

归纳一下,我们可以看到,一共有n顶红帽子,就会在第n天有人去猜自己是红帽子;而第n+1天,剩下的所有人都猜出自己是白帽子。

在我们这个“n=3”的例子里,红帽子(即看见2顶红帽和97顶白帽的人)的策略为:

Day 1:不猜;

Day 2:如果有人猜自己是红色,那么明天我猜自己是白色;如果依旧没人猜,那么明天我猜自己是红色。

白帽子(即看见3顶红帽和96顶白帽的人)的策略为:

Day 1:不猜:

Day 2:不猜;

Day 3:如果有人猜自己是红色,那么明天我猜自己是白色;没人猜,那么明天我猜自己是红色。

我们可以看出,策略不是一成不变的,前一刻的最优决策在下一刻可能不再为最优,因此必须根据别人的策略而调整自己的策略,这就是动态博弈。

所以,下次和小明踢球之前,一定要先说好,如果砸碎玻璃就一起抵赖好吗?

你也可以思考一下,如果把老师也包括进这个博弈中,老师要选择怎样的策略,才会让你俩就算说好一起抵赖,最后还是会坦白?想出来了可不要告诉老师哦!

发表评论

电子邮件地址不会被公开。 必填项已用*标注