第4单元 策略互动和社会困境

4.3 稻米—木薯博弈中的最优反应:纳什均衡

最优反应(best response)
在博弈论中,参与者的最优反应是指给定其他参与者已采用的策略,能够给该参与者带来最偏好结果的策略。

博弈论描述了社会互动;它也有助于预测可能发生的结果。为此,我们需要引入最优反应的概念:即给定其他参与者已采用的策略的情况下,能够给该参与者带来最偏好结果的策略。

在图4.2b中,我们使用称为支付矩阵的标准格式来表示阿尼尔和巴拉在稻米—木薯博弈中的支付。矩阵是由数字组成的矩形数组。在矩阵的每个单元格中,第一个数字(位于左下角)是行参与者的支付,第二个数字是列参与者的支付。每个参与者的支付不仅取决于自己能种植多少作物,还取决于市场需求。市场需求描述了市场价格如何随供给量的变化而变化。

考虑这个博弈中的最优反应。假设你是阿尼尔,考虑一个假设情境:巴拉已经选择种植稻米。那么,哪种反应能让你获得更高的支付?你应该选择种植木薯,这样你将获得6的支付,而如果你种植稻米则只能获得4的支付。

按照图4.2b中的步骤,分析每种可能的情境,找出各自的最优反应。可以使用点和圆圈简便地在支付矩阵中标记最优反应。

在稻米—木薯博弈中寻找最优反应
全屏
https://core-book-server.vercel.app/microeconomics/zh/04-strategic-interactions-03-nash-equilibrium.html#图4-2b

图4.2b 在稻米—木薯博弈中寻找最优反应

寻找最优反应:
全屏
https://core-book-server.vercel.app/microeconomics/zh/04-strategic-interactions-03-nash-equilibrium.html#图4-2ba

寻找最优反应

从行参与者(阿尼尔)开始思考,并提出问题:“如果列参与者巴拉选择种植稻米,那么阿尼尔的最优反应是什么?”

如果巴拉种植稻米,阿尼尔的最优反应:
全屏
https://core-book-server.vercel.app/microeconomics/zh/04-strategic-interactions-03-nash-equilibrium.html#图4-2bb

如果巴拉种植稻米,阿尼尔的最优反应

如果巴拉选择稻米,那么阿尼尔的最优反应是选择木薯,因为种植木薯能给他带来 6 的支付,而选择稻米则只有 4 的支付。在左下角的单元格中画一个点,表示行参与者的最优反应。

如果巴拉种植木薯,阿尼尔的最优反应:
全屏
https://core-book-server.vercel.app/microeconomics/zh/04-strategic-interactions-03-nash-equilibrium.html#图4-2bc

如果巴拉种植木薯,阿尼尔的最优反应

如果巴拉选择木薯,那么阿尼尔的最优反应是稻米,因为种植稻米能给他带来 6 的支付,而选择木薯则只有 5 的支付。在右上角的单元格中画一个点。

现在寻找列参与者的最优反应:
全屏
https://core-book-server.vercel.app/microeconomics/zh/04-strategic-interactions-03-nash-equilibrium.html#图4-2bd

现在寻找列参与者的最优反应

如果阿尼尔选择稻米,那么巴拉的最优反应也是选择种植稻米,因为种植稻米能给他带来 4 的支付,而种植木薯则只有 3 的支付。单元格中的圆圈表示列参与者的最优反应。在左上角的单元格中画一个圆圈。

如果阿尼尔选择木薯,巴拉的最优反应还是稻米:
全屏
https://core-book-server.vercel.app/microeconomics/zh/04-strategic-interactions-03-nash-equilibrium.html#图4-2be

如果阿尼尔选择木薯,巴拉的最优反应还是稻米

最后,如果阿尼尔选择木薯,那么巴拉的最优反应仍是稻米,因为种植稻米能给他带来 6 的支付,而种植木薯则只有 2 的支付。在左下角的单元格中画一个圆圈。

互为最优反应:
全屏
https://core-book-server.vercel.app/microeconomics/zh/04-strategic-interactions-03-nash-equilibrium.html#图4-2bf

互为最优反应

在左下角的单元格中,点和圆圈重合。阿尼尔选择种植木薯,而巴拉选择种植稻米时,双方都在作出对彼此选择的最优反应。

均衡(equilibrium)
均衡指的是一种可以自我维持的状态或模型结果:一旦达到这种结果,除非受到外部力量的干扰,否则不会发生变化。这里的“外部力量”指的是由模型之外因素所决定的事物。

图4.2b中使用的方法揭示出存在一对策略是彼此的最优反应:阿尼尔选择木薯,巴拉选择稻米。我们称这对策略为博弈的一个均衡。一般来说,均衡是一种自我维持的状态。在这个案例中,阿尼尔选择木薯,巴拉选择稻米是一个均衡。因为在这种情况下,双方在看到对方的选择后,都不会想要改变自己的决策。

纳什均衡(Nash equilibrium)
纳什均衡是指在一个经济结果中,任何一方都无法通过单方面改变自己的行动来获得一个自己更偏好的结果。用更正式的表达方式来说,在博弈论中,纳什均衡被定义为博弈中每个参与者的策略组成的一组策略,其中每个参与者的策略都是对其他所有参与者所选策略的最优反应。 参见:博弈论
看不见的手博弈(invisible hand game)
看不见的手博弈指存在一个唯一的纳什均衡且该均衡帕累托有效的博弈。 参见:纳什均衡帕累托有效

在博弈论中,如果一组策略中每个参与者的策略都是对其他参与者的策略作出的最优反应,那么这组策略就称为纳什均衡。在这个博弈的纳什均衡中:

  • 阿尼尔选择木薯
  • 巴拉选择稻米

我们可以用简写(木薯,稻米)来表示这个纳什均衡,其中先列出行参与者阿尼尔的策略。我们能预测阿尼尔和巴拉会采用他们的纳什均衡策略吗?从阿尼尔的角度来看,他可能不确定该怎么做,因为他的最优反应取决于巴拉的决策(他想选择与巴拉相反的选项)。然而,巴拉的决策更容易:无论阿尼尔选择什么,巴拉选择稻米都能获得更高的支付。所以我们预期他会选择稻米。然后,如果阿尼尔考虑到巴拉的决策,他也会预期巴拉会选择稻米。这就简化了阿尼尔的问题:他对稻米的最优反应是选择木薯。

通过这种推理,我们可以看出,纳什均衡确实为我们提供了博弈结果的一个合理预测。通常,如果一个博弈只有一个纳什均衡,那么它就是最有可能的结果——尽管在某些博弈中我们可能对这个预测更有信心,而在另一些博弈中则可能不那么确定。

在纳什均衡中,阿尼尔和巴拉各自专注于一种作物,从而避免了市场过剩。此外,两种作物都种植在适合它们生长的土地上。简单地追求自身利益,即选择给他们带来最高支付的策略,结果是每个参与者都获得能获得的最高支付。

在这个例子中,如果参与者有办法协调他们的决策,那么纳什均衡也是他们各自会选择的结果。尽管他们各自独立地追求自身利益,但市场价格会引导他们达到最符合自身利益的结果。

图4.2是一种有时被称为看不见的手博弈的博弈类型的示例,因为它反映了亚当·斯密的观点,即非显式的(看不见的)力量可以引导参与者达到对双方都有利的结果。看不见的手博弈的特点是,参与者们在各自追求自身利益的情况下,最终达成一个对所有参与者都有利的均衡。

追求自身利益而不顾及他人被认为是道德上不良的行为,但经济学分析已经发现,在某些条件下,这种行为可以产生社会期望的结果。在接下一节中,我们将讨论一个截然相反的案例。在这个案例中,追求自身利益的决策带来的结果并不符合任何参与者的利益:囚徒困境博弈。

问题4.2 选择正确的表述(多选题)

比起看足球,亚当更喜欢去电影院。而贝拉则喜欢看足球甚于去电影院。当其中一位选择了自己最喜欢的活动时,另一个人更愿意一起度过时光,而不是分开度过一下午。下表展示了贝拉和亚当选择不同活动时所得到的享受水平(支付),第一个数字是亚当的享受水平,第二个数字是贝拉的享受水平。

全屏

根据上述信息,我们可以得出以下结论:

  • 无论贝拉选择什么,亚当选择足球都会让他受益更多。
  • 纳什均衡是(电影,足球);换句话说,亚当选择电影,贝拉选择足球。
  • 纳什均衡使得两位参与者的享受水平达到最大。
  • 没有任何一个参与者愿意偏离纳什均衡。
  • 无论贝拉选择什么,亚当选择电影都会让他受益更多(如果贝拉选择足球,他选择电影能得到4,而选择足球只能得到3;如果贝拉选择电影,他选择电影能得到6,而选择足球只能得到1)。
  • 纳什均衡是(电影,足球):如果亚当选择电影,贝拉的最优反应是选择足球(支付是3而不是2);如果贝拉选择足球,亚当的最优反应是选择电影(支付是4而不是3)。
  • I在纳什均衡中,亚当的支付是4,贝拉的支付是3。如果他们能达成一致去电影院,亚当将达到最高的幸福程度(支付是6)。同样,如果他们能达成一致去看足球,贝拉将达到最高的幸福程度(支付是5)。
  • 这是纳什均衡的一个性质。给定其他参与者的行动,每个参与者都在尽力而为,因此每个人都不能从单方面改变自己当前的行为中获益。

伟大的经济学家 约翰·纳什

Portrait of John Nash

约翰·纳什(John Nash,1928—2015)21岁时在普林斯顿大学完成了他的博士论文。这篇论文虽然只有27页长,但它推动了博弈论(当时还是一个鲜为人知的数学分支)的发展,进而引发了经济学的剧变。他回答了这样一个问题:当人们进行策略互动时,他们会作出什么选择?他的答案就是我们现在所说的纳什均衡,即给定所有其他参与者的策略,每个人的策略都为自己争取最好的结果。

纳什证明了在广泛类型的博弈中,均衡必然存在。在这些博弈中,参与者可以有任何目标:例如,他们可以是自利的、利他的、怀有恶意的或者是公正的。他的证明令人瞩目,因为20世纪有不少杰出数学家,如埃米尔·博雷尔(Emile Borel)和约翰·冯·诺伊曼(John von Neumann),都曾经尝试解决这个问题,但未能取得足够进展。这个结果非常有用,因为策略可能非常复杂,需要为可能出现的任何情况制定一个完整的行动计划。虽然国际象棋中不同策略的数量比已知宇宙中原子的数量还要多,但我们知道国际象棋存在一个纳什均衡,尽管我们不知道这个均衡是白方获胜、黑方获胜,还是保证和棋。

博弈论彻底改变了经济学几乎所有的领域,而如果没有纳什的均衡概念和存在性证明,这是不可能的。但这并不是他对经济学的唯一开创性贡献——他还对讨价还价理论(theory of bargaining)作出了杰出的原创性贡献。纳什还对数学作出了开创性的贡献,为此他获得了享有盛誉的阿贝尔奖。

纳什因其研究成果与他人共同获得了1994年诺贝尔奖。后来同样获得该奖项的经济学家罗杰·迈尔森(Roger Myerson)将纳什均衡描述为经济思想史上最重要的贡献之一。

纳什在大半生中饱受精神疾病的困扰,甚至需要住院治疗。从1959年开始,他因精神分裂症而出现幻觉。在经历了被他描述为“思维部分错乱的25年”后,他重返普林斯顿大学从事教学和研究工作。有关其洞察力与疾病的故事被记录在书籍《美丽心灵》1(该书后来被改编成由罗素·克劳主演的电影)中。

练习4.2 《美丽心灵》中的博弈论

在电影《美丽心灵》中,约翰·纳什在酒吧里与朋友们讨论他们应该与哪位女士交谈时,萌生了博弈论的想法。

  1. 观看电影中该场景的YouTube视频,并根据所描述的情境绘制一个支付矩阵。(提示:您可能会发现这篇文章和解释很有帮助。)
  2. 根据您的支付矩阵,解释约翰·纳什在电影中向朋友们提出的方案是否为纳什均衡。
  1. Sylvia Nasar. 2011. A Beautiful Mind: The Life of Mathematical Genius and Nobel Laureate John Nash. New York: Simon & Schuster.