4단원 전략적 상호작용과 사회적 딜레마

4.3 쌀-카사바 게임에서 최적대응: 내시균형

최적대응: 게임이론에서, 경기자의 최적대응이란 다른 경기자들이 채택한 전략 하에서, 해당 경기자가 가장 선호하는 결과를 가져올 전략을 말한다.

게임이론은 사회적 상호작용을 설명하는 이론이다. 게임이론은 이때 어떤 일이 일어날지를 예측할 수 있게 해 준다. 이를 위해 최적대응이란 개념이 필요하다. 최적대응은 다른 경기자들이 선택한 전략에 대해 해당 경기자에게 가장 선호하는 결과를 가져다 줄 전략을 말한다.

그림 4.2b는 쌀-카사바 게임에서 아닐과 발라의 보수를 보수행렬이라 부르는 표준적 방식으로 나타내고 있다. 행렬이란 단순히 숫자들의 직사각형 배열이다. 각 상자에서 첫 번째 숫자(두 숫자 중 왼쪽 아래 숫자)는 행 경기자에게 돌아갈 보수이다(이 경기자의 이름이 A로 시작하므로, 그의 보수가 먼저 표시된다고 기억해도 좋다). 두 번째 숫자는 열 경기자의 보수이다. 각 보수는 경기자가 얼마나 많은 작물을 재배할 수 있는지에 따라 결정될 뿐만 아니라 수요에도 의존한다. 즉, 시장 가격이 공급량에 따라 어떻게 변하는가에 따라 달라진다.

이 게임에서 최적대응을 생각해 보자. 여러분이 아닐이라고 가정하고 발라가 쌀을 재배하기로 선택한 가상의 경우를 생각해보자. 어떤 대응이 더 높은 보수를 가져다 줄까? 카사바를 재배하면 된다(카사바를 재배하면 6의 보수를 받는데, 카사바 대신 쌀을 재배할 경우에는 보수가 4에 그치기 때문이다).

그림 4.2b의 단계를 따라가며 각 가상의 상황에서 최적대응을 찾아 보자. 여기에서는 점과 원을 보수행렬에 표시하여 최적대응을 추적해 가는 간단한 방법을 사용하고 있다.

이 그림은 아닐과 발라가 선택할 수 있는 행동을 보여준다. 그 행동은 쌀을 재배하거나 카사바를 재배하는 것이다. 보수는 (아닐의 보수, 발라의 보수) 형태로 표시된다. 둘 다 쌀을 재배하면, 보수는 (4, 4)이다. 아닐이 쌀을 재배하고 발라가 카사바를 재배하면, 보수는 (6, 3)이다. 아닐이 카사바를 재배하고 발라가 쌀을 재배하면, 보수는 (6, 6)이다. 둘 다 카사바를 재배하면, 보수는 (5, 2)이다. 발라가 쌀을 재배할 때 아닐의 최적대응은 카사바를 재배하는 것이다. 발라가 카사바를 재배할 때 아닐의 최적대응은 쌀을 재배하는 것이다. 아닐이 쌀을 재배할 때 발라의 최적대응은 쌀을 재배하는 것이다. 아닐이 카사바를 재배할 때 발라의 최적대응도 쌀을 재배하는 것이다.

전체화면

https://core-book-server.vercel.app/microeconomics/ko/04-strategic-interactions-03-nash-equilibrium.html#그림-4-2b

그림 4.2b 쌀-카사바 게임에서 최적대응 찾기

최적대응 찾기: 이 그림은 아닐과 발라가 선택할 수 있는 행동을 보여준다. 그 행동은 쌀을 재배하거나 카사바를 재배하는 것이다. 보수는 (아닐의 보수, 발라의 보수) 형태로 표시된다. 둘 다 쌀을 재배하면, 보수는 (4, 4)이다. 아닐이 쌀을 재배하고 발라가 카사바를 재배하면, 보수는 (6, 3)이다. 아닐이 카사바를 재배하고 발라가 쌀을 재배하면, 보수는 (6, 6)이다. 둘 다 카사바를 재배하면, 보수는 (5, 2)이다.

전체화면

https://core-book-server.vercel.app/microeconomics/ko/04-strategic-interactions-03-nash-equilibrium.html#그림-4-2ba

최적대응 찾기

행 경기자(아닐)에서 시작해서 다음과 같이 질문을 던져보자. “열 경기자(발라)가 쌀을 선택하기로 결정한다면 아닐의 최적대응은 무엇인가?”

발라가 쌀을 재배할 때 아닐의 최적대응: 이 그림은 아닐과 발라가 선택할 수 있는 행동을 보여준다. 그 행동은 쌀을 재배하거나 카사바를 재배하는 것이다. 보수는 (아닐의 보수, 발라의 보수) 형태로 표시된다. 둘 다 쌀을 재배하면, 보수는 (4, 4)이다. 아닐이 쌀을 재배하고 발라가 카사바를 재배하면, 보수는 (6, 3)이다. 아닐이 카사바를 재배하고 발라가 쌀을 재배하면, 보수는 (6, 6)이다. 둘 다 카사바를 재배하면, 보수는 (5, 2)이다. 발라가 쌀을 재배할 때 아닐의 최적대응은 카사바를 재배하는 것이다.

전체화면

https://core-book-server.vercel.app/microeconomics/ko/04-strategic-interactions-03-nash-equilibrium.html#그림-4-2bb

발라가 쌀을 재배할 때 아닐의 최적대응

발라가 쌀을 선택하면, 아닐의 최적대응은 카사바이다. 카사바를 선택하면 쌀을 선택했을 때 얻을 수 있는 4보다 높은 6의 보수를 얻는다. 표의 좌측 하단칸에 점을 찍어보자. 칸에 찍혀 있는 점은 행 경기자의 최적대응을 의미한다.

발라가 카사바를 재배할 때 아닐의 최적대응: 이 그림은 아닐과 발라가 선택할 수 있는 행동을 보여준다. 그 행동은 쌀을 재배하거나 카사바를 재배하는 것이다. 보수는 (아닐의 보수, 발라의 보수) 형태로 표시된다. 둘 다 쌀을 재배하면, 보수는 (4, 4)이다. 아닐이 쌀을 재배하고 발라가 카사바를 재배하면, 보수는 (6, 3)이다. 아닐이 카사바를 재배하고 발라가 쌀을 재배하면, 보수는 (6, 6)이다. 둘 다 카사바를 재배하면, 보수는 (5, 2)이다. 발라가 쌀을 재배할 때 아닐의 최적대응은 카사바를 재배하는 것이다. 발라가 카사바를 재배할 때 아닐의 최적대응은 쌀을 재배하는 것이다.

전체화면

https://core-book-server.vercel.app/microeconomics/ko/04-strategic-interactions-03-nash-equilibrium.html#그림-4-2bc

발라가 카사바를 재배할 때 아닐의 최적대응

발라가 카사바를 선택한다면, 아닐의 최적대응은 쌀이다. 쌀을 선택함으로써 5보다 높은 6의 보수를 얻는다. 마찬가지로 표의 우측 상단칸에 점을 찍어보자.

열 경기자의 최적대응을 찾아보자: 이 그림은 아닐과 발라가 선택할 수 있는 행동을 보여준다. 그 행동은 쌀을 재배하거나 카사바를 재배하는 것이다. 보수는 (아닐의 보수, 발라의 보수) 형태로 표시된다. 둘 다 쌀을 재배하면, 보수는 (4, 4)이다. 아닐이 쌀을 재배하고 발라가 카사바를 재배하면, 보수는 (6, 3)이다. 아닐이 카사바를 재배하고 발라가 쌀을 재배하면, 보수는 (6, 6)이다. 둘 다 카사바를 재배하면, 보수는 (5, 2)이다. 발라가 쌀을 재배할 때 아닐의 최적대응은 카사바를 재배하는 것이다. 발라가 카사바를 재배할 때 아닐의 최적대응은 쌀을 재배하는 것이다. 아닐이 쌀을 재배할 때 발라의 최적대응은 쌀을 재배하는 것이다.

전체화면

https://core-book-server.vercel.app/microeconomics/ko/04-strategic-interactions-03-nash-equilibrium.html#그림-4-2bd

열 경기자의 최적대응을 찾아보자

아닐이 쌀을 선택한다면, 발라의 최적대응 또한 쌀을 선택하는 것이다. 쌀을 선택하면 3보다 높은 4의 보수를 얻는다. 원으로 열 경기자의 최적대응을 나태내 보자. 표의 왼쪽 상단칸에 원을 그려보자.

아닐이 카사바를 선택할 때 발라의 최적대응은 동일하다: 이 그림은 아닐과 발라가 선택할 수 있는 행동을 보여준다. 그 행동은 쌀을 재배하거나 카사바를 재배하는 것이다. 보수는 (아닐의 보수, 발라의 보수) 형태로 표시된다. 둘 다 쌀을 재배하면, 보수는 (4, 4)이다. 아닐이 쌀을 재배하고 발라가 카사바를 재배하면, 보수는 (6, 3)이다. 아닐이 카사바를 재배하고 발라가 쌀을 재배하면, 보수는 (6, 6)이다. 둘 다 카사바를 재배하면, 보수는 (5, 2)이다. 발라가 쌀을 재배할 때 아닐의 최적대응은 카사바를 재배하는 것이다. 발라가 카사바를 재배할 때 아닐의 최적대응은 쌀을 재배하는 것이다. 아닐이 쌀을 재배할 때 발라의 최적대응은 쌀을 재배하는 것이다. 아닐이 카사바를 재배할 때 발라의 최적대응도 쌀을 재배하는 것이다.

전체화면

https://core-book-server.vercel.app/microeconomics/ko/04-strategic-interactions-03-nash-equilibrium.html#그림-4-2be

아닐이 카사바를 선택할 때 발라의 최적대응은 동일하다

마지막으로, 아닐이 카사바를 선택한다면 발라의 최적대응은 다시 쌀이다. 쌀을 선택하면 발라는 2대신 6의 보수를 얻게 된다. 표의 왼쪽 하단칸에 원을 그려보자.

상호 최적대응: 이 그림은 아닐과 발라가 선택할 수 있는 행동을 보여준다. 그 행동은 쌀을 재배하거나 카사바를 재배하는 것이다. 보수는 (아닐의 보수, 발라의 보수) 형태로 표시된다. 둘 다 쌀을 재배하면, 보수는 (4, 4)이다. 아닐이 쌀을 재배하고 발라가 카사바를 재배하면, 보수는 (6, 3)이다. 아닐이 카사바를 재배하고 발라가 쌀을 재배하면, 보수는 (6, 6)이다. 둘 다 카사바를 재배하면, 보수는 (5, 2)이다. 발라가 쌀을 재배할 때 아닐의 최적대응은 카사바를 재배하는 것이다. 발라가 카사바를 재배할 때 아닐의 최적대응은 쌀을 재배하는 것이다. 아닐이 쌀을 재배할 때 발라의 최적대응은 쌀을 재배하는 것이다. 아닐이 카사바를 재배할 때 발라의 최적대응도 쌀을 재배하는 것이다.

전체화면

https://core-book-server.vercel.app/microeconomics/ko/04-strategic-interactions-03-nash-equilibrium.html#그림-4-2bf

상호 최적대응

좌측 하단칸에서 점과 원이 일치하고 있다. 아닐이 카사바를 선택하고 발라는 쌀을 선택할 때, 두 경기자들은 서로에게 최적대응을 하고 있다.

균형: 균형은 스스로 지속되는 상황이나 모형의 결과이다. 균형에 도달했다면, 외적인 교란 요인이 작동하지 않는 한, 더 이상 변화는 없다. “외적인 교란 요인”이란 모형 외부에서 결정되는 요인들을 말한다.

그림 4.2b에서 사용된 방법은 상호 최적대응이 되는 하나의 전략쌍, 즉, 아닐은 카사바를 선택하고 발라는 쌀을 선택하는 상황이 존재한다는 것을 보여준다. 이 전략쌍을 게임의 균형이라고 부른다. 일반적으로 균형이란 스스로 지속되는 상황을 의미한다. 이 경우, 아닐이 카사바를 선택하고 발라가 쌀을 선택하는 것이 균형인 이유는 두 사람 모두 상대방이 무엇을 선택했는지를 확인하더라도 자신의 결정을 바꾸고 싶어 하지 않을 것이기 때문이다.

개념 확인하기

경제모형에서 균형의 또 다른 예들은 2.8절 을 참고하라

내시균형: 내시균형은 관련된 개인들 중 어느 누구도 자신의 행동을 일방적으로 변경함으로써 자신이 선호하는 결과를 가져올 수 없는 경제적 결과이다. 수학적으로 말하자면, 게임 이론에서 내시균형은 게임의 각 참여자의 전략들의 쌍으로 정의되며, 내시균형을 이루는 전략쌍에서 각 참여자의 전략은 다른 모든 참여자들이 선택한 전략들에 대한 최적대응이다. 이와 관련하여 게임이론을 참조하라.
보이지 않는 손 게임: 단일 내쉬 균형이 존재하며 그 균형이 파레토효율적인 게임을 보이지 않는 손 게임이라고 부를 수 있다. 이와 관련하여 내시균형, 파레토효율성을 참조하라.

게임이론에서, 각 경기자가 다른 경기자들의 전략에 최적대응을 하는 상황을 내시균형.이라고 한다. 이 게임의 내시균형에서는

아닐은 카사바를 선택하고,
발라는 쌀을 선택한다.

이 내시균형을 (카사바, 쌀)이라고 간단히 표현할 수 있으며, 이때 행 경기자(아닐)의 전략을 먼저 쓴다. 그렇다면 아닐과 발라가 이 내시균형 전략을 선택하리라고 예측할 수 있을까? 아닐의 입장에서 이 결정을 생각해 보면, 그의 최적대응은 발라의 결정에 달려 있기 때문에 확실히 무엇을 선택해야 할지 확신하지 못할 수도 있다(아닐은 발라와 반대되는 선택을 하고자 한다). 하지만 발라의 결정은 더 간단하다. 즉, 아닐이 무엇을 선택하든, 발라는 쌀을 선택하면 더 높은 보수를 얻는다. 따라서 발라가 쌀을 선택할 것이라고 예상할 수 있다. 그렇다면 아닐도 발라의 결정을 생각할 때 발라가 쌀을 선택할 것이라고 예상할 것이다. 이는 아닐에게 문제를 단순하게 만들어 준다. 발라가 쌀을 재배할 때 그에 대한 아닐의 최적대응은 카사바이다.

이런 방식으로 추론하면, 내시균형이 게임 결과에 대한 그럴듯한 예측을 제공한다는 것을 알 수 있다. 일반적으로 게임에 단 하나의 내시균형이 존재한다면 그것이 가장 그럴듯한 결과가 된다. 다만, 일부 게임에서는 이 게임만큼 내시균형의 예측력에 대해 그렇게 확신하지 못할 수도 있다.

내시균형에서는 아닐과 발라가 각각 하나의 농작물에 특화되어 있으므로, 시장 과잉공급을 피할 수 있다. 또한, 두 작물 모두 재배에 적합한 토지에서 생산된다. 단순히 자신의 이익을 추구하는 것, 즉, 자신에게 가장 높은 보수를 주는 전략을 선택하는 것이 각 경기자에게 가능한 가장 높은 보수를 주는 결과로 이어진다.

이 예에서 내시균형은 두 사람이 결정을 사전에 조정할 수 있었다면 두 사람이 선택했을 결과이기도 하다. 그들이 독립적으로 자신의 이익을 추구했음에도 불구하고 시장 가격에 의해 자신들에게 최선의 이익이 되는 결과로 인도되었다.

그림 4.2는 때로는 보이지 않는 손 게임이라고 불리는 게임 유형의 한 예이다. 이 게임은 애덤 스미스의 아이디어, 즉 명시적이지 않은(“보이지 않는”) 힘이 두 경기자 모두에게 가장 최선인 결과로 인도한다는 생각을 반영하고 있기 때문이다. 보이지 않는 손 게임은 경기자들이 각자의 이익을 추구하며 독립적으로 행동할 때, 결과적으로 관련된 모든 경기자의 공동 이익에 부합하는 균형에 도달하게 된다는 특징을 가진다.

타인을 고려하지 않고 자신의 이익만을 추구하는 것은 때때로 도덕적으로 나쁘다고 평가될 수 있지만, 경제학적 분석은 그것이 사회적으로 바람직한 결과로 이어질 수 있는 조건들을 확인했다. 다음 절에서는 이와 반대로 이기적인 결정의 결과가 어느 경기자에게도 이익이 되지 않는 대조적 사례, 즉 죄수의 딜레마 게임에 대해 살펴볼 것이다.

확인문제 4.2 다음 중 옳은 것을 모두 골라라.

다음 중 옳은 것을 모두 골라라.

아담은 축구를 보는 것보다 영화관에 가는 것을 더 선호한다. 반면에 벨라는 영화관에 가는 것보다 축구를 보는 것을 더 선호한다. 한 사람이 자신이 좋아하는 활동을 선택한다면, 다른 사람은 오후를 혼자 보내기보다는 함께 시간을 보내는 것을 선호한다. 다음 표는 두 사람의 선택에 따른 벨라와 아담의 즐거움 수준(보수)을 나타낸다(첫 번째 숫자는 아담의 즐거움 수준을, 두 번째 숫자는 벨라의 즐거움 수준을 나타낸다).

이 그림은 아담과 벨라가 취할 수 있는 행동을 나타내고 있다. 여기서 이들이 취할 수 있는 행동은 축구를 보는 것 혹은 영화를 보러 가는 것이다. 보수는 (아담의 보수, 벨라의 보수)로 표시된다. 만일 두 사람 모두 축구를 선택하면 보수는 (3, 5)이다. 아담이 축구를 선택하고 벨라가 영화를 선택하면 보수는 (1, 1)이다. 아담이 영화를 선택하고 벨라가 축구를 선택하면 보수는 (4, 3)이며, 두 사람 모두 영화를 선택할 때 보수는 (6, 2)이다.

전체화면

위 정보를 토대로, 다음을 읽고 옳은 것을 모두 골라라.

아담은 벨라가 무엇을 선택하든 축구를 선택하는 것이 더 나을 것이다.
내시균형은 (영화, 축구) 이다. 즉, 아담은 영화를 선택하고 벨라는 축구를 선택한다.
내시균형은 두 경기자에게 가능한 가장 높은 수준의 즐거움을 준다.
두 경기자 모두 내시균형에서 벗어나고 싶어하지 않을 것이다.

아담은 벨라가 무엇을 선택하든 영화를 선택하는 것이 더 나을 것이다(벨라가 축구를 선택하면 축구에서 3을 받는 대신 영화에서 4를 받고, 벨라가 영화를 선택하면 축구에서 1을 받는 대신 영화관에서 6을 받는다).
내시균형은 (영화, 축구)이다: 아담이 영화를 선택하면 벨라의 최적대응은 축구를 선택하는 것이다(축구의 보수는 3이고 영화의 보수는 2이다). 벨라가 축구를 선택하면 아담의 최적대응은 영화를 선택하는 것이다(영화의 보수는 4이고 축구의 보수 3이다).
내시균형에서 아담은 4의 보수를 받고 벨라는 3의 보수를 받는다. 아담은 두 사람이 함께 영화관에 가기로 합의할 수 있다면 가장 높은 행복도(6의 보수)를 얻는다. 마찬가지로 벨라는 두 사람이 축구 관람에 합의할 때 가장 행복할 것이다(이때 벨라의 보수는 5이다).
이 진술은 내시균형의 성질이다. 경기자들은 다른 모든 경기자의 행동이 주어져 있다는 전제하에서 최선의 선택을 하고 있으므로, 각 개인은 자신만 현재의 행동을 변경할 때 이익을 얻지 못한다.

위대한 경제학자 존 내시

존 내시(1928–2015)는 21살에 프린스턴대학교에서 박사 학위를 받았다. 그의 박사 논문은 27페이지에 불과했는데, 당시에는 거의 알려지지 않은 수학의 한 분야였던 게임이론을 발전시킨 것이었다. 이 논문은 경제학에 혁신적인 변화를 가져왔다. 그는 질문을 던졌다. 사람들이 전략적으로 상호작용을 할 때, 이들이 어떤 행동을 할지 예측할 수 있을까? 그의 답은 오늘날 내시균형이라고 부르는 개념으로, 이 균형에서는 각 개인이 다른 모든 경기자의 전략을 바탕으로 자신에게 가장 최선이 되는 전략을 선택한다.

내쉬는 게임의 넓은 일반적 범주에서, 경기자들이 어떤 목표를 가지고 있든지 간에 균형이 반드시 존재한다는 것을 증명했다. 경기자들은 예를 들어 이기적일 수도 있고 이타적일 수도 있으며, 악의적일 수도 있고 공정할 수도 있다. 그의 증명은 매우 주목할 만한 것이었다. 그보다 앞서 에밀 보렐(Emile Borel), 존 폰 노이만(John von Neumann)과 같은 20세기의 저명한 수학자들도 동일한 문제에 도전했지만 큰 성과를 거두지 못했다. 내시가 증명한 결과는 매우 유용한데, 왜냐하면 전략은 매우 복잡할 수 있으며, 발생할 수 있는 모든 상황에 대한 완전한 행동 계획을 명시해야 하기 때문이다. 체스에서의 전략 수는 우주에 존재하는 원자의 수보다도 많지만, 우리는 백이 이길지, 흑이 이길지 아니면 무승부가 될지는 알 수 없어도 여기에도 내시균형이 반드시 존재한다는 것을 알게 되었다.

게임이론은 경제학의 거의 모든 분야를 완전히 변화시켰는데, 이는 내시의 균형 개념과 그 존재 증명 없이는 불가능했을 것이다. 하지만 이것이 그의 경제학에 대한 유일한 획기적인 기여가 아니었다. 그는 협상 이론에도 탁월한 기여를 했으며, 그 외에도 수학에 대한 선구적인 업적으로 권위 있는 아벨상을 수상하기도 했다.

내시는 1994년 노벨상을 공동 수상했다. 이후 노벨상을 수상한 경제학자 로저 마이어슨(Roger Myerson)은 내시균형에 대해 “경제사상사에서 가장 중요한 공헌 중 하나”라고 평가했다.

내시는 그의 생에 대부분 동안 입원이 필요할 정도의 정신 질환으로 고통받았다. 1959년부터 시작된 조현병으로 인해 환각을 경험하기도 했지만, 그가 “25년간의 부분적으로 망상에 사로잡혀 있었다”라고 표현했던 시기를 이겨내고 이후 프린스턴에서 다시 강의와 연구에 복귀하였다. 그의 통찰과 정신 질환에 관한 이야기는 책 <뷰티풀 마인드>(Beautiful Mind)에 담겨있고,¹ 러셀 크로 주연의 동명의 영화로도 제작된 바 있다.

연습문제 4.2 <뷰티풀 마인드>에 등장하는 게임이론

영화 <뷰티풀 마인드>(Beautiful Mind)에서 존 내시는 술집에서 어떤 여성에게 말을 걸어야 할지를 놓고 친구들과 대화를 나누다가 게임이론의 아이디어를 떠올린다.

영화 속 해당 장면을 담은 유튜브 영상을 시청한 후, 그 상황을 나타내는 보수행렬을 작성해 보자. (힌트: 이 글과 설명이 도움이 될 수 있을 것이다.)
작성한 보수행렬을 참고하여, 영화에서 존 내시가 친구들에게 제안한 것이 내시균형인지 아닌지 설명해보자.

Sylvia Nasar. 2011. A Beautiful Mind: The Life of Mathematical Genius and Nobel Laureate John Nash. New York: Simon & Schuster. ↩