燃文小说网

燃文小说网>博弈学与心理学的区分 > 第12课 蜈蚣博弈 如何抉择你都想要的鱼和熊掌(第1页)

第12课 蜈蚣博弈 如何抉择你都想要的鱼和熊掌(第1页)

第12课蜈蚣博弈:如何抉择你都想要的鱼和熊掌

如果打人能给你带来快乐,你会选择打人吗。我想很多人会说不会。这正如他们所说,假如我今天打了或欺负了他,他日后可能会报复,这种担心报复的心理部分抵消了打人带来的快乐。这个答案至少表明,你不打人不是因为你不想打人,或是因为道德方面的原因,而是考虑到了日后可能会给你带来麻烦。同样,在博弈对局中,我们现在的决策也很大程度上取决于对将来结果的预测。

什么是蜈蚣博弈的悖论

下棋的时候,我们要走一步棋,都要先对未来几步做一下预测,然后再确定这一步走哪个位置为好。在人生中,也是如此,我们在尝试做一件事情的时候,都会对结果进行分析预测,然后根据可能的情况作出合理的选择。这种博弈论就叫做倒推法。

倒推法又叫蜈蚣博弈,是由罗森塞尔(Rosenthal)提出的。它是这样一个博弈:两个参与者A、B轮流进行策略选择,可供选择的策略有“合作”和“背叛”(“不合作”)两种。假定A先选,然后是B,接着是A,如此交替进行。A、B之间的博弈次数为有限次,比如100次。假定这个博弈各自的支付给定如下:

全部合作

ABA……AB(100,100)

全部背叛

(1,1)(0,3)(2,2)(99,99)(98,101)

现在的问题是:A、B是如何进行策略选择的?

这个博弈因形状像一只蜈蚣,而被命名为蜈蚣博弈。

这个博弈的奇特之处是:当A决策时,他考虑博弈的最后一步即第100步;B在“合作”和“背叛”之间作出选择时,因“合作”给B带来100的收益,而“不合作”带来101的收益,根据理性人的假定,B会选择“背叛”。但是,要经过第99步才到第100步,在99步,A考虑到B在100步时会选择“背叛”——此时A的收益是98,小于B合作时的100,那么在第99步时,他的最优策略是“背叛”——因为“背叛”的收益99大于“合作”的收益98……如此推论下去,最后的结论是:在第一步A将选择“不合作”,此时各自的收益为1,远远小于大家都采取“合作”策略时的收益:A:100,B:100-99。

根据倒推法,结果是令人悲伤的。从逻辑推理来看,倒推法是严密的,但结论是违反直觉的。直觉告诉我们,一开始就采取不合作的策略获取的收益只能为1,而采取合作性策略有可能获取的收益为100。当然,A一开始采取合作性策略的收益有可能为0,但1或者0与100相比实在是太小了。直觉告诉我们采取合作策略是好的。而从逻辑的角度看,一开始A应取不合作的策略。我们不禁要问:是倒推法错了,还是直觉错了?

这就是蜈蚣博弈的悖论。

什么是悖论?悖论(paradox)来源于希腊语,para意即“超越”,doxos的意思是“相信”。Paradox的意思是:本来可以相信的东西不能相信,而有的东西看起来不可信但是反而是正确的。悖论指由肯定它真,就推出它假,由肯定它假,就推出它真的一类命题。在历史上有许多悖论。如“阿基里斯赶不上乌龟”的芝诺悖论,“一个克里特人说‘所有克里特人都说谎’”的说谎者悖论,“一个理发师说:‘我给所有不给自己理发的人理发’”的理发师悖论或罗素悖论,等等。这些悖论在历史上对于逻辑和数学的发展起了巨大的作用。

对于蜈蚣悖论,许多博弈专家都在寻求它的解答。在西方有研究博弈论的专家做过实验[目前通过实验验证集体的交互行为已成时尚,正如博弈论专家英国的宾莫(KenBinmore)所言,诺贝尔奖也无疑在考虑这方面的先驱者],实验发现,不会出现一开始选择“不合作”策略而双方获得收益1的情况。双方会自动选择合作性策略,从而走向合作。这种做法违反倒推法,但实际上双方这样做,要好于一开始A就采取不合作的策略。

倒推法似乎是不正确的。然而,我们会发现,即使双方开始能走向合作,即双方均采取合作策略,这种合作也不会坚持到最后一步。理性的人出于自身利益的考虑,肯定在某一步采取不合作策略。倒推法肯定在某一步要起作用。只要倒推法在起作用,合作便不能进行下去。

这个悖论在现实中的对应情形是,参与者不会在开始时确定他的策略为“不合作”,但他难以确定在何处采取“不合作”策略。

巧用倒推法计算自己的收益

一、由海盗分金的故事说起

如果打人能给你带来快乐,你会选择打人吗。我想很多人会说不会。这正如他们所说,假如我今天打了或欺负了他,他日后可能会报复,这种担心报复的心理部分抵消了打人带来的快乐。这个答案至少表明,你不打人不是因为你不想打人,或是因为道德方面的原因,而是考虑到了日后可能会给你带来麻烦。同样,在博弈对局中,我们现在的决策也很大程度上取决于对将来结果的预测。

有这样一个故事,船上有若干个海盗,要分抢来的若干枚金币。自然,这样的问题他们是由投票来解决的。投票的规则如下:先由最凶残的海盗来提出分配方案,然后大家一人一票表决,如果有50%或以上的海盗同意这个方案,那么就以此方案分配,如果少于50%的海盗同意,那么这个提出方案的海盗就将被丢到海里去喂鱼,然后由剩下的海盗中最凶残的那个海盗提出方案,依次类推。

我们先要对海盗们作如下假设:

1,每个海盗的凶残性都不同,而且所有海盗都知道别人的凶残性,也就是说,每个海盗都知道自己和别人在这个方案中的位置。另外,每个海盗都是很聪明的人,都能非常理智地判断得失,从而作出选择。最后,海盗间私底下的交易是不存在的,因为海盗除了自己谁都不相信;

2,一枚金币是不能被分割的,不可以你半枚我半枚;

3,每个海盗当然不愿意自己被丢到海里去喂鱼,这是最重要的;

4,每个海盗当然希望自己能得到尽可能多的金币;

5,每个海盗都是功利主义者,如果在一个方案中他得到了1枚金币,而下一个方案中,他有两种可能,一种得到许多金币,一种得不到金币,他会同意目前这个方案,而不会有侥幸心理;

6,最后,每个海盗都很喜欢其他海盗被丢到海里喂鱼。在不损害个人利益的前提下,他会尽可能投票让同伴去喂鱼。

现在,如果有10个海盗要分100枚金币,结果将会怎样呢?

要解决“海盗分金”问题,我们总是从最后的情形向前推,这样我们就知道在最后这一步中什么是好的和坏的策略。然后运用最后一步的结果,得到倒数第二步应该作策略选择,依次类推。要是直接从第一步入手解决问题,我们就很容易因这样的问题而陷入思维僵局:“要是我作这样的决定,下面一个海盗会怎么做?”

以这个思路,先考虑只有2个海盗的情况(所有其他的海盗都已经被丢到海里去喂鱼了)。不妨记他们为P1和P2,其中P2比较凶残。P2的最佳方案当然是:他自己得100枚金币,P1得0枚。投票时他自己的一票就足够50%了。

往前推一步。现在加一个更凶猛的海盗P3。P1知道———P3知道他知道———如果P3的方案被否决了,游戏就会只由P1和P2来继续,而P1就一枚金币也得不到。所以P3知道,只要给P1一枚金币,P1就会同意他的方案(当然,如果不给P1一枚金币,P1反正什么也得不到,宁可投票让P3去喂鱼)。所以P3的最佳策略是:P1得1枚,P2什么也得不到,P3得99枚。

P4的情况差不多。他只要得两票就可以了,给P2一枚金币就可以让他投票赞同这个方案,因为在接下来P3的方案中P2什么也得不到。P5也是相同的推理方法只不过他要说服他的两个同伴,于是他给每一个在P4方案中什么也得不到的P1和P3一枚金币,自己留下98枚。

依次类推,最终P10的最佳方案是:他自己得96枚,给每一个在P9方案中什么也得不到的P2、P4、P6和P8一枚金币。

已完结热门小说推荐

最新标签