即使是敌对国,诺贝尔经济学奖得主罗伯特·奥曼(Robert Aumann)认为,考虑到长远利益,合作才是合乎逻辑的选择。为何这么说?
且听罗伯特·奥曼来解释博弈论研究对于决策的指导意义。
博弈论(Game theory)并不仅仅是游戏。它是一门运用逻辑来理解应该如何做出决策并考虑他人选择的科学。尽管名为“博弈”,但它涉及的却是诸如商业、政治甚至战争等严肃的现实情境。
这篇文章解释了博弈论的内容,以及如何在许多现实世界的场景中使用它。我将解释博弈论如何揭示合作的根源,以及为什么研究它对于“减少敌意”很重要。我们将以一种优雅的博弈论方法作为结论,你可以将其应用在日常生活中。
罗伯特·奥曼(Robert Aumann,1930年-)教授因“通过博弈论分析增进了我们对冲突与合作的理解”,与托马斯·谢林(Thomas Schelling)教授共同获得2005年诺贝尔经济学奖。图源:诺奖官网
SAIXIANSHENG
早班车还是晚班车?
我研究的科学领域称为“博弈论”。事实上,博弈论并不仅仅是关于游戏的。下面,我们将从一些例子开始,来解释博弈论的含义。
假设你的爱好是收集名人的亲笔签名。有一天,你收到了来自附近小镇传奇签名收藏家克里斯的以下消息:
“在我85岁时,我决定结束我的签名收藏爱好。从今晚午夜开始,我会将我的全部收藏送给第一个到我家的人。如果有多人同时到达,我便将藏品平分给所有人。”
你知道,克里斯所在的镇上没有人对签名感兴趣,但在你的城镇有另一个收藏家贝丝。有两辆公交车从你的城镇开往克里斯家,一辆于早上5点出发,另一辆于早上9点出发。那你应该坐哪一辆呢?
如果你细细思考,便知道绝对应该坐早上5点的公交车。推理过程如下:
如果贝丝选择乘坐早上9点的公交车,那么你应该选择乘坐早上5点的公交车,从而独吞所有藏品;
而如果贝丝决定乘坐早上5点的公交车,那么你也应该这个点去,这样至少可以得到一半的藏品(如果选择乘坐早上九点的公交车,你将一无所获)。
因此,无论贝丝做出何种选择,你都应该乘坐早上5点的公交车。
但是,同样的推理对贝丝也适用。于是,现实往往是:你们二人都睡眼惺忪地上了早上5点的公交车,一起去分享克里斯的藏品。另一种选择是:如果你们都选择坐9点的公交车,那你们就都能睡个好觉,并且依然获得相同数量的藏品。但这种理想中的结果是不可能的!
如果你们二人都保持理性——即都做对自己最为有利的事,那么选择乘坐早上5点的公交车(并分享藏品)是唯一合理的选择。
现在,假设还有另一辆公交车在凌晨2点出发,那你又应该坐哪一辆?
与之前的情况不同,这次你的最佳选择取决于贝丝的做法。
a)如果贝丝乘坐早上9点的公交车,那你的最佳选择是5点的公交车。
b)如果贝丝乘坐早上5点或凌晨2点的公交车,那你的最佳选择是凌晨2点的公交车。
“贝丝会乘坐早上9点的公交车”这一假设合理吗?嗯,你知道贝丝是个聪明的女孩,所以你预计她会遵循和你一样的推理。因此,她不会选择早上9点的公交车——就像你也不会这么选一样。所以,情况(b)成立,你的最佳选择是凌晨2点的公交车,贝丝也是如此。因此,你和贝丝会再次睡眼朦胧地在凌晨2点的公交车上相遇,并得到与你们都坐9点公交车相同数量的藏品!
在这个公交车的例子中,你是否注意到了如何使用逻辑推理来找出最佳决策?这种推理方式正是博弈论的核心。博弈论是对决策进行逻辑分析的学科,特别是在涉及多方可能存在利益冲突的情况下,博弈论则会利用逻辑推理来分析这种情况。
SAIXIANSHENG
逻辑推理的另一示例
这里还有一个关于逻辑推理的例子。假设你和贝丝玩一个游戏,规则如下:首先,你们俩都秘密地在一张纸上写下数字1或2,然后公开各自的选择。如果贝丝写的是1,那么她要支付你所写的金额(美元);如果她写了2,那么你要支付她写下的金额。你应该怎么做?下面是可能的选择和结果的表格(表1):
如果贝丝写的是1,那么你写2更好;而如果贝丝写的是2,那么你写1更好。因此,为了确定你的最佳策略,你必须试图弄清楚贝丝会怎么选——但这很容易:对于贝丝来说,无论你写什么,选择2显然是更好的选择。所以如果贝丝很聪明,她将始终选择2,这意味着你应该写1。
就像上面公交车的例子一样,我们使用逻辑推理来分析情况并确定最佳策略。这就是“博弈论”——在涉及多方决策的情况下进行逻辑分析。重要的是,博弈论只是从纯粹的逻辑角度来分析每种情况,并不涉及情感和心理因素,它试图理性地确定最合乎逻辑的决策。
SAIXIANSHENG
如果不是游戏,那是什么?
“博弈论”(game theory)这个名字具有误导性,其实game theory大多与游戏(games)无关(尽管它也可以应用于游戏)。相反,博弈论考虑任何利益冲突的多方之间的互动,并使用逻辑推理(和数学)来分析这种互动。
实际上,博弈论可以应用于许多比收集亲笔签名更为严肃的场景,例如商业、政治,甚至战争。
我们再举一个例子。假设有A、B两个彼此敌对的邻国,两国都在边界线部署了军队。夜幕降临,除了几个站岗的士兵外,两国军队都回营入睡。但就在此时,A国的指挥官对副官说:“我有一个主意,对面的军队即将入睡,这正是我们夜袭的好机会。我们集结所有兵力,便可以轻松突破守卫,并突袭睡梦中的其他人。快!叫醒我们所有士兵,现在出发去对面!”
但这个副官想睡觉,于是他说:“长官,如果B国的军队不睡觉呢?这样我们就没办法突袭了。” 指挥官回答道:“如果是这样,那我们更要赶到边界线去,否则他们就会袭击我们!” 带着这个完全合乎逻辑的论证,A国整个军队出发边界线,准备战斗。
但对B国的军队来说,同样的理性论证也是正确的。因此,他们也前往边界线,于是两支队伍就在这里相遇——一场残酷的冲突在所难免。生灵涂炭,造孽啊!
不幸的是,同样的逻辑似乎在每个夜晚都成立……那么,这两支军队注定要夜复一夜地发生无尽的冲突吗?既然如此,博弈论是否在告诉我们,“无尽的战斗”是唯一合理的行为?
好在答案是否定的。事实上,高级博弈论分析会告诉我们相反的情况:在这种两军对垒的情况下,逻辑推理会促使合作增加,而不是对抗。
合作增加?这怎么可能呢?是指挥官的逻辑有问题吗?是,也不是——如果单独考虑每个夜晚的情况,指挥官的逻辑确实无可辩驳。但是,当考虑到冲突会夜复一夜地重复发生时,逻辑就会发生变化。
为什么会这样呢?
再考虑一下指挥官和副官的对话。指挥官想要发起进攻,但此时副官说:“长官,昨天我沿着边界线散步时发现了B国的副官。他隔着围栏大声说,他们计划今晚入睡,并警告我说,如果我们趁他们睡觉时偷袭,他们必定报复,并会从现在开始每天晚上袭击我们!于是我便冲着他们喊,说我们也会如此。”
至此,今晚突袭仍然是最符合逻辑的举动吗?可能就不是了。尽管突袭会给进攻方带来一些短期优势,但这种优势将会被随之而来夜复一夜的无意义战斗所带来的整体损失湮灭掉,这对双方皆如此!因此,两支军队不如都选择不进攻,好好睡上一觉——这样,同样的事情(和平)会在之后的夜晚不停重复上演……
可以看到,相比单次选择,“重复的互动”完全改变了情况!虽然在单次情况下,对抗是合乎逻辑的举动;但当互动将多次发生时,合作就是合乎逻辑的行为。博弈论告诉我们,在重复的互动中合作往往是最合乎逻辑的行为,即使是在对立的双方之间!这意味着合作通常是最佳选择——即使你只关心自己的利益。
SAIXIANSHENG
合作,让世界更美好
为什么我要强调合作呢?这正是我获得诺贝尔奖的原因!
用诺奖评委会的话来说:罗伯特·奥曼因其关于重复博弈的理论而获得诺贝尔经济学奖,该理论增进了我们对合作的先决条件的理解。
是的,诺奖委员会认为“合作是重复互动的结果”这一观念非常重要,它值得一个诺贝尔奖!
如果你仔细思考,会发现这个理论本身其实很简单;如果你再次遇到上述情况,你可能最好是与对方合作。请注意,这个理论虽然简单,却极其重要。我们的世界充满了敌意、战争和冲突,我们都希望这种境遇能够改变。如何促成这种改变呢?有些人在和平组织工作或志愿服务,还有的人则利用自己的政治或经济力量,这些都是有价值且重要的事业。作为一名科学家,我相信系统而科学的研究同样重要。我相信了解冲突和合作的原因是促进和平的第一要义。
如果不了解物理定律,你就无法建造飞机;如果不了解癌细胞的运作机制,就无法找到癌症的治疗方法。同样,我相信你无法在不了解合作真正源头的情况下进行合作。如果你不了解和平及战争的真正根源,便无法促进和平。了解人们为何战斗、为何合作,了解是什么导致了各国战事或和平共处,是我们希望试图改变人类行为以谋求更好发展的必要条件。博弈论为我们提供了这样的理解,因此,我把我对博弈论的研究视作我为改善世界所做出的小小贡献。
我将以一个巧妙而实用的博弈论想法来结束这篇文章,你可以在日常生活中用来减少嫉妒和冲突。假如妈妈给你和弟弟带了美味的甜甜圈,香草味的面圈上撒满了巧克力和糖果。但她只买了一个——所以你们得分着吃。
最好的分配方式是什么?一个解决方案是让妈妈把甜甜圈切成两半,然后你们一人一半。但是,妈妈也许知道这样可能会让其中一个人不高兴并嫉妒另一个人。无论她如何公平地分切甜甜圈,其中一个人都很可能会认为自己的那一块更小、巧克力或糖果更少,或者有什么其他的缺陷。但是,让你或弟弟自己来分配甜甜圈可能也绝非好主意!
那么,到底该如何分配这个甜甜圈呢?
在这里,博弈论提出了一个优雅的解决方案。建议使用以下步骤(图1):
1.弟弟用他认为合适的任何方式将甜甜圈切成两块;
2.你选择其中一块;
3.他得到剩下的一块。
图1 分配食物的巧妙方法
(A)假设妈妈给你和弟弟买了一份美味的甜点,她该如何以你们二人都满意的方式来进行分配?(B)博弈论会建议你:首先,让弟弟将零食切成两块。(C)随后,你来二选一,然后弟弟得到另外一块。
用这种方式,你和弟弟两人都不会有任何怨言。