第4单元 策略互动和社会困境
4.4 占优策略均衡和囚徒困境
在图4.2b的稻米—木薯博弈中,无论对手选择做什么,巴拉的最优反应都是选择稻米。当这种情况发生时,我们说该参与者具有一个占优策略。巴拉的占优策略是稻米。
图4.3展示了另一个版本稻米—木薯博弈的支付情况。在这里,我们假设巴拉的土地更适合种植稻米,而阿尼尔的土地更适合种植木薯。请使用点圈法来找出最优反应。你应该会发现,在这个博弈中,两个参与者都有占优策略。
图4.3 另一个稻米—木薯博弈:参与者双方都有占优策略。
- 占优策略均衡(dominant strategy equilibrium)
- 占优策略均衡是指所有参与者的策略均为占优策略的纳什均衡。
您还应该发现,纳什均衡与之前相同:阿尼尔选择木薯,巴拉选择稻米。但由于木薯是阿尼尔的占优策略,稻米是巴拉的占优策略,因此我们可以特别有信心地预测这一结果。我们说(木薯,稻米)不仅是纳什均衡,也是占优策略均衡。
占优策略均衡对参与者双方都有益。就像之前部分的博弈一样,这是一个看不见的手博弈。但在接下来的例子中,情况会有所不同。
害虫防治博弈
假设阿尼尔和巴拉现在面临着另一个问题。他们正在各自决定如何处理在他们相邻田地中破坏作物的害虫。他们各有两个可行的策略:
- 第一种策略是使用一种名为“毒潮”(Toxic Tide)的廉价化学药剂(以下简称农药)。它能杀死周围数英里内的所有昆虫,但也会渗入他们共同使用的水源中。
- 另一种策略是采用害虫综合防治(integrated pest control,IPC),即将益虫引入农场。益虫会吃掉害虫。
如果只有一人选择使用农药,损害将相对有限。但如果两人都选择使用农药,水污染将成为一个严重问题,他们需要购买昂贵的过滤系统。图4.4a描述了他们之间的互动。
图4.4a 害虫防治博弈中的社会互动。
阿尼尔和巴拉都清楚这些结果。他们知道自己的支付(即出售作物的收入减去害虫防治方法的成本以及任何所需水过滤系统的费用)不仅取决于自己的决定,还取决于对方的选择。这是一个策略互动。他们的支付情况如图4.4b所示。
图4.4b 害虫防治博弈的支付矩阵。
他们将如何进行这个博弈?我们仍然可以使用点圈法来分析(在矩阵中绘制点和圆圈)。
阿尼尔的最优反应是:
- 如果巴拉选择害虫综合防治:阿尼尔会选择农药,因为这种方法能廉价地根除害虫,且水污染较少。
- 如果巴拉选择农药:阿尼尔也会选择农药。因为害虫综合防治成本更高,且由于巴拉的化学制品会杀死益虫,害虫综合防治无法发挥作用。
因此,农药是阿尼尔的占优策略。同样地,可以验证农药也是巴拉的占优策略。所以,我们预测他们都会使用农药。双方参与者都使用农药是这个博弈的占优策略均衡。
预测的结果对双方都不利:如果他们各自选择使用农药,他们的支付都为2。但如果他们都选择使用害虫综合防治,他们的支付都会更高,均为3。
- 囚徒困境(prisoners’ dilemma)
- 囚徒困境是一种博弈,它有一个占优策略均衡,但也存在另一种能为所有参与者带来更高支付的替代结果。因此,纳什均衡并不是帕累托有效的。
害虫防治博弈及其不理想的结果,是囚徒困境这一博弈论概念的一个具体示例。
囚徒困境(The prisoners’ dilemma)
这个博弈的名字来源于一个关于两个囚犯(我们称他们为特尔玛和露易丝)的故事。他们的策略要么是指控对方参与他们可能共同犯下的罪行,要么否认对方参与其中。
如果特尔玛和露易丝都选择否认,他们将会因较轻的罪行被判刑1年。
如果其中一个人指控另一个人,而另一个人否认,那么指控者将立即被释放(判刑0年),而另一个人将被判长期监禁(10年)。
最后,如果特尔玛和露易丝都选择指控对方,他们都会被判刑。由于与警察的合作,他们的刑期从10年减少到5年。博弈的支付如图4.5所示。支付是指监禁年数,因此露易丝和特尔玛更偏好较低的数字,即更短的刑期。
图4.5 囚徒困境(支付为监禁年数)。
在囚徒困境中,占优策略均衡(即双方都选择指控对方)对双方而言,结果通常比选择相反策略(即双方都否认)更差。
特尔玛和露易丝的故事虽然是虚构的,但囚徒困境理论却被广泛应用于许多现实问题中。在经济学案例中,这种对双方都有利的策略(否认)通常被称为合作,而占优策略(指控)则被称为背叛。需要注意的是,合作仅指这种有益策略的名称,并不意味着双方已就如何行动达成某种协议。即便参与者能事先讨论策略,根据博弈规则,他们仍需独立作出决定。
- 外部效应,外部性 (external effect,externality)
- 外部效应发生在某人的决策对他人带来利益或成本,而这些利益或成本未被决策者考虑在内时。外部效应也称为外部性。
在经济互动中,当参与者仅追求自身利益时,可能导致理想的结果(例如稻米—木薯博弈)或不理想的结果(例如囚徒困境和害虫防治博弈)。囚徒困境描述了参与者因未考虑其行为对他人的成本和收益的影响而导致不理想结果的情境。这种情况下,我们说决策存在外部效应。例如,若阿尼尔选择害虫综合防治,巴拉会选择农药,因为这对他更有利,但他却忽视了这一决定给阿尼尔带来的外部成本。后续章节将探讨如何通过不同的偏好、社会行为规范的影响或达成约束性协议来避免外部效应的不理想结果。政策制定者也可以通过改变博弈规则或调整支付来协助避免这些不理想的结果。
练习4.3 囚徒困境中的策略选择
在英国电视智力竞赛节目《金球》(Golden Balls)中,两名参与者有机会选择分享奖金或互相抢夺对方的奖金。但在作出最终选择之前,他们被允许进行交流。请观看一段视频剪辑,了解一对参与者是如何进行这个博弈的,并回答以下问题。
- 绘制一个支付矩阵来表示视频中描述的博弈。这个矩阵应包含参与者、可行的行动以及每种可能结果下的支付。在绘制时,请忽略交流阶段。
- 根据您绘制的支付矩阵和这次博弈的最终结果,解释第一个参与者(尼克)提出的计划的逻辑。
- 如果博弈的参与者是朋友而不是陌生人,您认为他们在交流阶段的行为和实际选择会有何不同?
问题4.3 选择正确的表述(多选题)
迪米特里奥斯和阿米拉在国际投资银行担任外汇交易员,他们因涉嫌参与一系列市场操纵交易正在接受警方调查。下表列出了不同策略下他们所面临的监禁后果(以监禁年限表示),这些后果取决于他们是选择互相指控还是否认犯罪。表中的第一个数字代表迪米特里奥斯的判决结果,第二个数字代表阿米拉的判决结果(负数表示监禁年限,即损失)。我们假设这是一个一次性的同时博弈。
基于这些信息,我们可以得出以下结论:
- 指控对于迪米特里奥斯和阿米拉来说都是占优策略,因此无论对方采取何种行动,他们都会选择指控。
- 对于迪米特里奥斯和阿米拉来说,指控是一个占优策略。因此,他们最终都选择指控并分别被判八年监禁,这个结果是一个占优策略均衡。
- 无论迪米特里奥斯采取何种行动,指控都是阿米拉的最优反应,因此她总是会选择指控。这是一个占优策略。
- 只有当迪米特里奥斯和阿米拉都选择否认时,才会出现这个结果。但由于指控对他们俩来说都是占优策略,所以这种情况永远不会发生。
练习4.4 政治广告
在许多民主国家,政治候选人被允许使用某些形式的大众媒体,如公共或商业电视,来宣传他们的竞选活动并攻击对手。许多人认为这种政治广告(竞选广告)是囚徒困境的经典示例。
- 请从你选择的国家中选取一个最近的政治竞选活动作为例子,解释你是否认为在这种情况下,政治广告确实构成了囚徒困境。
- 写出一个支付矩阵的例子来阐释政治广告构成囚徒困境的情况。