约翰·纳什在中。
方弦
万事皆为博弈
博弈论翻译自英语的“game theory”,原意是“游戏的理论”。在某种意义上,可以说博弈论就是对于游戏的研究。“石头剪子布”可能是大家最熟悉的游戏。一般意义上的博弈也非常类似,其中有数位参与者,每人可以选择一定的行动,最后根据给定的规则判定每个人的得失。
博弈的种类繁多,从简单的“石头剪子布”到复杂的象棋,都算是博弈。广说,社会上很多经济活动,小至选择商品和购买保险,大至公司并购和货币政策,都可以抽象为某种博弈。这就是经济学家对博弈论感兴趣的原因。
但类似象棋这样的博弈,需要每个玩家反复做多次选择,研究的难度相当大。饭要一口一口吃,在博弈论发展的早期,数学家考虑的都是像“石头剪子布”那样,所有玩家都知道同样的信息,而每个玩家只需要同时做一次选择就能决出确定结果的博弈。在这种博弈中,玩家有多种策略的选择。比如一直出石头,或者各以三分之一的概率选择三种手势,这都是可行的策略。
数学家希望能计算每个博弈中收益最大化的最优策略。因为我们事先并不知道对手的策略,所以希望找到一个即使在最坏情况下仍然能够最大化收益的策略。形象地说,就是“做最好的准备,做最坏的打算”。但这种最优策略是否存在呢?博弈论的开山祖师、数学家冯·诺伊曼证明了,对于所谓的“零和博弈”,也就是一方的胜利相当于另一方的失败的游戏,这种最优策略必定存在。我们平时玩的游戏都是零和博弈。
但这毕竟不是一个你死我活的世界,虽然一方的得益常常意味着另一方的损失,但双赢的局面也能存在。冯·诺伊曼的无法处理各方收益总和不为零的情况,在这种“非零和博弈”下,因为双方的收益没有联系,所以最优策略不总是存在。那么,在这类博弈中,应该如何选择策略呢?
才能共赢
举例来说,假设你很喜欢粤菜,而你的朋友喜欢西餐。今天晚上你们打算出去就餐。如果分开吃的话,两人都会觉得独自用餐索然无味。如果一起吃粤菜,两位会高兴,但你会更高兴一些;如果吃的是西餐,则是你的朋友更高兴。现在两人分别从家里出发,应该选择什么策略呢?
这是一个典型的非零和博弈。在这场博弈中,最好的情况当然是两人一起用餐。但如果我们用零和游戏中最优策略的方法分析的话,每个人应该采取的策略显然是去吃自己喜爱的餐点,这种“最优策略”带来的结局却是最糟糕的。矛盾在于,在零和游戏中,因为玩家的收益就是对方的损失,所以玩家清楚对方的目的就是减少玩家本人的收益。但现在双方的得失并不矛盾,玩家无法得悉对方的想法,之前的“最优策略”自然无效。我们需要一个更好的概念来涵括对方的想法。