博弈学与心理学的区分_第12课蜈蚣博弈如何抉择你都想要的鱼和熊掌第1页

燃文小说网>博弈学与心理学的区分 > 第12课蜈蚣博弈如何抉择你都想要的鱼和熊掌（第1页）

第12课蜈蚣博弈如何抉择你都想要的鱼和熊掌（第1页）

第12课蜈蚣博弈：如何抉择你都想要的鱼和熊掌

如果打人能给你带来快乐，你会选择打人吗。我想很多人会说不会。这正如他们所说，假如我今天打了或欺负了他，他日后可能会报复，这种担心报复的心理部分抵消了打人带来的快乐。这个答案至少表明，你不打人不是因为你不想打人，或是因为道德方面的原因，而是考虑到了日后可能会给你带来麻烦。同样，在博弈对局中，我们现在的决策也很大程度上取决于对将来结果的预测。

什么是蜈蚣博弈的悖论

下棋的时候，我们要走一步棋，都要先对未来几步做一下预测，然后再确定这一步走哪个位置为好。在人生中，也是如此，我们在尝试做一件事情的时候，都会对结果进行分析预测，然后根据可能的情况作出合理的选择。这种博弈论就叫做倒推法。

倒推法又叫蜈蚣博弈，是由罗森塞尔（Rosenthal）提出的。它是这样一个博弈：两个参与者A、B轮流进行策略选择，可供选择的策略有“合作”和“背叛”（“不合作”）两种。假定A先选，然后是B，接着是A，如此交替进行。A、B之间的博弈次数为有限次，比如100次。假定这个博弈各自的支付给定如下：

全部合作

ABA……AB（100，100）

全部背叛

（1，1）（0，3）（2，2）（99，99）（98，101）

现在的问题是：A、B是如何进行策略选择的？

这个博弈因形状像一只蜈蚣，而被命名为蜈蚣博弈。

这个博弈的奇特之处是：当A决策时，他考虑博弈的最后一步即第100步；B在“合作”和“背叛”之间作出选择时，因“合作”给B带来100的收益，而“不合作”带来101的收益，根据理性人的假定，B会选择“背叛”。但是，要经过第99步才到第100步，在99步，A考虑到B在100步时会选择“背叛”——此时A的收益是98，小于B合作时的100，那么在第99步时，他的最优策略是“背叛”——因为“背叛”的收益99大于“合作”的收益98……如此推论下去，最后的结论是：在第一步A将选择“不合作”，此时各自的收益为1，远远小于大家都采取“合作”策略时的收益：A：100，B：100-99。

根据倒推法，结果是令人悲伤的。从逻辑推理来看，倒推法是严密的，但结论是违反直觉的。直觉告诉我们，一开始就采取不合作的策略获取的收益只能为1，而采取合作性策略有可能获取的收益为100。当然，A一开始采取合作性策略的收益有可能为0，但1或者0与100相比实在是太小了。直觉告诉我们采取合作策略是好的。而从逻辑的角度看，一开始A应取不合作的策略。我们不禁要问：是倒推法错了，还是直觉错了？

这就是蜈蚣博弈的悖论。

什么是悖论？悖论（paradox）来源于希腊语，para意即“超越”，doxos的意思是“相信”。Paradox的意思是：本来可以相信的东西不能相信，而有的东西看起来不可信但是反而是正确的。悖论指由肯定它真，就推出它假，由肯定它假，就推出它真的一类命题。在历史上有许多悖论。如“阿基里斯赶不上乌龟”的芝诺悖论，“一个克里特人说‘所有克里特人都说谎’”的说谎者悖论，“一个理发师说：‘我给所有不给自己理发的人理发’”的理发师悖论或罗素悖论，等等。这些悖论在历史上对于逻辑和数学的发展起了巨大的作用。

对于蜈蚣悖论，许多博弈专家都在寻求它的解答。在西方有研究博弈论的专家做过实验［目前通过实验验证集体的交互行为已成时尚，正如博弈论专家英国的宾莫（KenBinmore）所言，诺贝尔奖也无疑在考虑这方面的先驱者］，实验发现，不会出现一开始选择“不合作”策略而双方获得收益1的情况。双方会自动选择合作性策略，从而走向合作。这种做法违反倒推法，但实际上双方这样做，要好于一开始A就采取不合作的策略。

倒推法似乎是不正确的。然而，我们会发现，即使双方开始能走向合作，即双方均采取合作策略，这种合作也不会坚持到最后一步。理性的人出于自身利益的考虑，肯定在某一步采取不合作策略。倒推法肯定在某一步要起作用。只要倒推法在起作用，合作便不能进行下去。

这个悖论在现实中的对应情形是，参与者不会在开始时确定他的策略为“不合作”，但他难以确定在何处采取“不合作”策略。

巧用倒推法计算自己的收益

一、由海盗分金的故事说起

有这样一个故事，船上有若干个海盗，要分抢来的若干枚金币。自然，这样的问题他们是由投票来解决的。投票的规则如下：先由最凶残的海盗来提出分配方案，然后大家一人一票表决，如果有50%或以上的海盗同意这个方案，那么就以此方案分配，如果少于50%的海盗同意，那么这个提出方案的海盗就将被丢到海里去喂鱼，然后由剩下的海盗中最凶残的那个海盗提出方案，依次类推。

我们先要对海盗们作如下假设：

1，每个海盗的凶残性都不同，而且所有海盗都知道别人的凶残性，也就是说，每个海盗都知道自己和别人在这个方案中的位置。另外，每个海盗都是很聪明的人，都能非常理智地判断得失，从而作出选择。最后，海盗间私底下的交易是不存在的，因为海盗除了自己谁都不相信；

2，一枚金币是不能被分割的，不可以你半枚我半枚；

3，每个海盗当然不愿意自己被丢到海里去喂鱼，这是最重要的；

4，每个海盗当然希望自己能得到尽可能多的金币；

5，每个海盗都是功利主义者，如果在一个方案中他得到了1枚金币，而下一个方案中，他有两种可能，一种得到许多金币，一种得不到金币，他会同意目前这个方案，而不会有侥幸心理；

6，最后，每个海盗都很喜欢其他海盗被丢到海里喂鱼。在不损害个人利益的前提下，他会尽可能投票让同伴去喂鱼。

现在，如果有10个海盗要分100枚金币，结果将会怎样呢？

要解决“海盗分金”问题，我们总是从最后的情形向前推，这样我们就知道在最后这一步中什么是好的和坏的策略。然后运用最后一步的结果，得到倒数第二步应该作策略选择，依次类推。要是直接从第一步入手解决问题，我们就很容易因这样的问题而陷入思维僵局：“要是我作这样的决定，下面一个海盗会怎么做？”

以这个思路，先考虑只有2个海盗的情况（所有其他的海盗都已经被丢到海里去喂鱼了）。不妨记他们为P1和P2，其中P2比较凶残。P2的最佳方案当然是：他自己得100枚金币，P1得0枚。投票时他自己的一票就足够50%了。

往前推一步。现在加一个更凶猛的海盗P3。P1知道———P3知道他知道———如果P3的方案被否决了，游戏就会只由P1和P2来继续，而P1就一枚金币也得不到。所以P3知道，只要给P1一枚金币，P1就会同意他的方案（当然，如果不给P1一枚金币，P1反正什么也得不到，宁可投票让P3去喂鱼）。所以P3的最佳策略是：P1得1枚，P2什么也得不到，P3得99枚。

P4的情况差不多。他只要得两票就可以了，给P2一枚金币就可以让他投票赞同这个方案，因为在接下来P3的方案中P2什么也得不到。P5也是相同的推理方法只不过他要说服他的两个同伴，于是他给每一个在P4方案中什么也得不到的P1和P3一枚金币，自己留下98枚。

依次类推，最终P10的最佳方案是：他自己得96枚，给每一个在P9方案中什么也得不到的P2、P4、P6和P8一枚金币。

燃文小说网

燃文小说网>博弈学与心理学的区分 > 第12课蜈蚣博弈如何抉择你都想要的鱼和熊掌（第1页）

第12课蜈蚣博弈如何抉择你都想要的鱼和熊掌（第1页）

已完结热门小说推荐

最新标签

燃文小说网

燃文小说网>博弈学与心理学的区分 > 第12课 蜈蚣博弈 如何抉择你都想要的鱼和熊掌（第1页）

第12课 蜈蚣博弈 如何抉择你都想要的鱼和熊掌（第1页）

已完结热门小说推荐

最新标签

燃文小说网>博弈学与心理学的区分 > 第12课蜈蚣博弈如何抉择你都想要的鱼和熊掌（第1页）

第12课蜈蚣博弈如何抉择你都想要的鱼和熊掌（第1页）