본문 바로가기
리더십 입문 노트

4. 협력과 내시균형 Nash Equilibrium #한봉규

by 에치필 한봉규 2023. 1. 6.

안녕하세요. 필립의 전략 입문 노트입니다. 앞 글 1분 요약하고 오늘 주제 내시 균형을 함께 공부하겠습니다. 장광설 없이 곧바로 시작하겠습니다. 

 

앞 글 1분 요약입니다. 상황분석 툴로서 게임이론을 쓸 때 죄수의 딜레마를 구성하는 요소는 세 가지였습니다. 게임에 참여하는 플레이어, 각 플레이어가 취할 수 있는 전략, 그리고 그 전략의 이익이 그것입니다. 이 세 요소를 한눈에 파악할 수 있는 것을 '이익표'라고 부르며, 이 표는 앨버트 터커 교수가 게임이론을 직관적으로 설명하기 위해 1950년 대 만들었다는 것 까지였습니다. 

앨버트 터커 교수의 죄수의 딜레마 표를 보면서 든 생각은 어떤 복잡한 개념 또는 추상적 개념을 보기 쉽게 만드는 데에는 시각화가 효과적이라는 사실은 진리인 듯합니다. 이 점을 적극 활용해야겠습니다. 앞 글 1분 요약이었습니다.    

 

terrificparenting.com

 

오늘 주제는 '내시 균형 Nash Equlibrium'입니다. 내시 균형은 스탠퍼드 대학교 수학과 존 내시 교수가 1951년 발표한 '비협조 게임 Non-Cooperative Games'에서 제시한 개념입니다. 죄수의 딜레마에서 매우 중요한 역할을 할 뿐만 아니라 왜, '딜레마'라는 이름을 붙였는지 결정적인 단서를 제공했고, 나아가서는 우리가 협력해야 하는 이유도 밝혀냈다고 볼 수 있습니다. 

 

 

죄수의 딜레마 표를 다시 꺼내겠습니다. 통상 [침묵-침묵]이 서로에게 가장 큰 이익이기 때문에 협력해야 한다고 말합니다. 협력의 중요성을 설명할 때 자주 인용하는 대목입니다. 하지만 표 하나 덜렁 내놓고 마치 넷 중 서로에게 이익이 가장 큰 것 하나를 고르시오라는 느낌이 들곤 합니다. 이런 느낌을 다른 말로 비약이라고 합니다.

 

 

요컨대 [침묵-침묵]이 왜, 각 플레이어에게 가장 큰 이익이 되는지 설명하는 과정이 빠졌기 때문입니다.

내시 균형은 스탠퍼드 대학교 수학과 존 내시 교수가 1951년 발표한 '비협조 게임 Non-Cooperative Games'를 통해 알려진 것입니다. 내시 균형은 죄수의 딜레마에 매우 중요한 역할을 합니다. 죄수의 딜레마가 왜, 딜레마 인지를 결정적인 단서를 제공했기 때문입니다.

 

 

 


 

그 빠진 부분 중심에 있는 것이 바로 '내시 균형'입니다. 이 내시 균형을 설명하지 않으면 [침묵 - 침묵, 두 죄수 모두 1년 형]이 왜 중요하고, 협력은 왜 해야 하는지를 알 수 있습니다. 자, 그럼 지금부터 내시 균형 속으로 걸어가 보겠습니다. 

 

 

상대 전략에 대해서 자신의 최적 대응을 찾았을 때를 전략의 균형 상태라고 말합니다. 이 균형 상태의 다른 말이 바로 내시 균형입니다. 존 내시 교수의 연구 결과여서 그의 이름을 딴 것입니다. 영화 뷰티풀 마인드(2002 개봉, 러셀 크로우 주연)는 바로 존 내시 일대기를 그린 것이기도 하죠. 

 

ibs.re.kr

 


 

그럼 내시 균형을 함께 찾아볼까요? 죄수의 딜레마 표를 다시 꺼냅니다. 각각 플레이어에게는 각각 2개 전략 '침묵'과 '자백'이 있습니다. 이 전제 하에서 우선 상대 전략을 고정한 후 자신의 전략을 따져 보고, 자신에게 가장 큰 이익을 가져다주는 것을 선택합니다. 이때를 가리켜 '전략의 균형 상태'라고 말하고, '최적 전략 선택'이라고도 합니다.

 

 

예를 들어 상대 B 전략을 '침묵'으로 고정하면, A는 '침묵' 또는 '자백' 중 자신에게 이익이 되는 전략을 선택하는 것을 말합니다. 즉, 표의 왼쪽 두 칸입니다. A 입장에서 B가 침묵하면, 두 사람 모두 1년, A 자신이 자백하면 본인 석방, B는 10년 형입니다. 따라서 A에게 최적 전략은 B가 부인하면 자신은 자백하는 것입니다. [자백 - 침묵] 행렬 석방에 일단 동그라미를 칩니다.

 

 

이번에는 상대 B 전략을 '자백'으로 고정합니다. A의 최적 전략은 역시 '자백'입니다. [자백 - 자백] 행렬 5년에 동그라미를 칩니다. 이와 같은 방식으로 상대방 B도 A의 전략을 고정한 채로 B 자신의 최적 전략에 동그라미를 치면, 공교롭게도 상대 A와 함께 동그라미가 두 개 있는 곳은 [자백 - 자백, 둘 다 5년 형] 부분입니다. 바로 이 부분이 각 플레이어가 상대 전략에 대해서 최적 대응한 '전략의 균형 상태' 즉, 내시 균형입니다. 

 

 

 

 

한데 표를 자세히 보면 이상한 점이 하나 있습니다. 두 사람이 모두 [침묵 - 침묵]을 하면 둘 다 1년 형인데, 두 사람은 이 대안을 선택하지 않고 [자백 - 자백]을 각자 자신의 최적 전략이라고 판단하고 선택합니다. 왜, 이런 선택을 할까요?

 

 

내시 균형은 매우 안정적인 것이 특징입니다. 더 나은 대안이 있음에도 이를 바꾸지 않고 내시 균형에 안착하려는 경향성이 강하다는 것인데, 이는 상대방에 대한 불신이 안주하려는 성향을 더 강하게 만들기 때문입니다.

 

 

이를테면, 더 나은 대안을 발견한 A는 자신이 침묵했을 때, B도 침묵한다는 강한 확신과 서로를 신뢰해야 하는 데, 이에 대해서 불신한다면 자신이 침묵을 선택하는 것은 최악의 선택이기 때문입니다. B가 자백하면 A는 10년 형이기 때문이죠. 게임이론에서는 죄수의 딜레마와 같은 유형을 동시선택게임이라고 합니다. 즉, 동시 선택 게임은 상대방에 대한 절대적인 신뢰가 없으면 더 나은 대안을 선택할 수 없다는 것이 시사점이라고 할 수 있습니다. 

 

 

그리고 더 나은 대안이 있음에도 선택할 수 없는 아이러니한 상황이 계속되기 때문에 딜레마라는 이름을 붙인 것입니다. 마치 아버지를 아버지라 부르지 못하는 홍길동의 심경을 이 죄수의 딜레마에서 이해하게 될 줄은 몰랐습니다. 

 

dongascience.com

 


 

여담으로 죄수의 딜레마와 같은 동시 선택 게임인 가위 바위 보 게임을 게임이론으로 풀어 보면서 이 시간을 마무리하겠습니다. 결론부터 말씀드리면 가위 바위 보 게임에는 내시 균형이 없습니다. 왜냐하면 상대방 전략을 고정할 수 없기 때문입니다. 이 말은 반대로 상대방의 전략을 고정한 채로 자신의 최적 전략을 찾을 때 내시 균형을 발견할 수 있는데, 그 내시 균형은 곧 딜레마 상태라는 점이라는 것입니다. 그래서 우리가 해야 할 일은 이 내시 균형을 깨는 방안을 찾는 것입니다. 

 

 

실제로 이 내시 균형 발견 이후 게임이론 연구 주제는 '어떻게 하면 이 내시 균형을 깰 수 있을까?'에 모아졌고, 행동 경제학이 급부상하면서 인류의 미래는 협력에 달려 있다는 담론이 만들어졌다고 할 수 있습니다. 이 협력에 대한 담론 여러분은 어떻게 생각하시나요. 먼저 자신의 내시 균형을 한번 찾아보는 것부터 시작해 볼 수 있을 것 같습니다. 함께 찾아보고 자신의 내시 균형이 있으면 덧글로 공유해 주시면 이 또한 소통의 내시 균형을 깨는 실천이지 않을까 합니다. 오늘은 여기까지입니다.