내쉬 균형에서의 최선대응 찾기 연습
본문 바로가기

용어 정리, 이슈/경제

내쉬 균형에서의 최선대응 찾기 연습

728x90

1. 내쉬 균형에서의 최선대응

게임이론에서, 최선대응(best response)이란다른 플레이어의 전략을 취하는 플레이어에게 가장 좋은 결과(outcome)를 내는 전략(strategy) 말합니다. 이 '최선대응'이란 개념은 내쉬 균형의 핵심으로, 게임의 각 플레이어는 다른 플레이어의 전략에 대한 최선의 대응을 선택하는 것이죠.

기획재정부의 시사경제용어사전의 예시에 따르면, '두 차량 A와 B가 좌측통행인지 우측통행인지 모르는 2차선 도로에서 마주보고 운전을 할 때, A가 오른쪽을 택할 때, B 또한 오른쪽을 택하면 이는 최선대응이 되는 것입니다. 이제 아래표들을 보고 최선대응이 무엇인지 찾는 연습을 해봅시다.

 

2. 내쉬 균형에서의 최선대응 찾기

2-1. 죄수의 딜레마

  죄수 B
자백 부인
죄수 A 자백 (5,5) (0,20)
부인 (20,0) (1,1)

그 유명한 상대의 선택을 알지 못하고 선택지를 골라야 하는 죄수의 딜레마입니다. 숫자들은 자백 혹은 부인 했을 때의 형량으로, (죄수 A의 형량, 죄수 B의 형량)으로 표현됩니다.

 

죄수 A를 기준으로, 죄수 B가 자백을 한 경우, 죄수 A는 자백을 해서 5년형을 받는 것이 최선대응입니다.

만일, 죄수 B가 부인을 한 경우, 죄수 A는 이번에도 자백하는 것이 최선대응입니다.

 

죄수 B를 기준으로, 죄수 A가 자백을 한 경우, 죄수 B는 자백을 해서 5년형을 받는 것이 최선대응입니다.

만일, 죄수 A가 부인을 한 경우, 죄수 A는 이번에도 자백하는 것이 최선대응입니다.

 

따라서, 죄수 A와 죄수 B는 모두 자백을 하는 것이 최선대응이 됩니다.

2-2. 치킨 게임

  플레이어 2
멈춘다 안멈춘다
플레이어 1 멈춘다 (-100, -100) (-500, 100)
안멈춘다 (100, -500) (-100000, -100000)

두 명이 서로 마주보고 차 엑셀을 밟는데, 누군가 먼저 브레이크를 밟으면 바보 취급 받는 치킨 게임입니다.

여기서 -100은 약한 조롱거리를 받게 되는 것, -500은 강한 조롱거리를 받게 되는 것, +100은 조롱거리에서 벗어나는 것, -100000은 사망하게 되는 것을 말합니다.

 

플레이어 1을 기준으로, 플레이어 2가 '멈춘다'를 선택한다면, '안멈춘다'를 선택하는 것이 최선대응입니다.

만일 플레이어 2가 '안멈춘다'를 선택한다면, '멈춘다'를 선택하는 것이 최선대응입니다.

 

플레이어 2를 기준으로, 플레이어 1가 '멈춘다'를 선택한다면, '안멈춘다'를 선택하는 것이 최선대응입니다.

만일 플레이어 1가 '안멈춘다'를 선택한다면, '멈춘다'를 선택하는 것이 최선대응입니다.

 

따라서, 플레이어 1과 플레이어2는 상대 플레이어의 선택을 파악한 뒤, 각기 다른 최선대응적 선택을 하게 됩니다.

 

2-3. 매칭 페니

  플레이어 2
동전 앞면 동전 뒷면
플레이어 1 동전 앞면 (+1, -1) (-1, +1)
동전 뒷면 (-1, +1) (+1, -1)

매칭 페니는 두 명의 플레이어 모두 같은 동전 면이 나오면 플레이어 1이 승리하며, 한 명의 플레이어에게 다른 동전 면이 나온다면 플레이어 2가 승리하는 게임입니다.

 

플레이어 1을 기준으로, 플레이어 2가 '동전 앞면'을 선택한다면, '동전 앞면'을 선택하는 것이 최선대응입니다.

만일 플레이어 2가 '동전 뒷면'을 선택한다면, '동전 뒷면'을 선택하는 것이 최선대응입니다.

 

플레이어 2를 기준으로, 플레이어 1이 '동전 앞면'을 선택한다면, '동전 뒷면'을 선택하는 것이 최선대응입니다.

만일 플레이어 1가 '동전 뒷면'을 선택한다면, '동전 앞면'을 선택하는 것이 최선대응입니다.

 

이렇게 되면 서로 서로가 원하는 방향이 다르기 때문에 최선대응적 선택을 하기 어렵게 됩니다.

 

반응형