Game Theory Chapter 1 약 3분

제1강: 죄수의 딜레마와 보상 매트릭스

O
Oiyo Contributor

제1강: 죄수의 딜레마 — 개인의 합리성이 집단의 비극을 만드는 방식

“모두에게 더 나은 결과가 있음에도 불구하고, 왜 우리는 서로를 배신하게 되는가?”

게임 이론(Game Theory)은 의사결정자들이 서로의 행동에 영향을 받는 상황에서 최적 전략을 연구하는 학문입니다. 존 폰 노이만과 오스카 모르겐슈테른의 1944년 저작 Theory of Games and Economic Behavior에서 출발했으며, 경제학·정치학·진화생물학·컴퓨터과학에 걸쳐 폭넓게 적용됩니다.

게임 이론의 기본 구성요소
요소정의죄수의 딜레마 예시
플레이어 (Players)의사결정 주체죄수 A, 죄수 B
전략 (Strategies)각 플레이어가 선택할 수 있는 행동침묵(협력) 또는 자백(배신)
보상 (Payoffs)전략 선택 결과로 얻는 결과값형량 (낮을수록 좋음)
균형 (Equilibrium)아무도 전략을 바꾸고 싶지 않은 상태둘 다 배신 (내쉬 균형)

1. 시나리오: 죄수의 딜레마

두 명의 용의자가 분리된 심문실에 있습니다. 서로 소통할 수 없는 상황에서 검사는 각자에게 다음 제안을 합니다.

죄수의 딜레마 — 결과 매트릭스
나의 선택 \ 상대의 선택상대: 침묵 (협력)상대: 자백 (배신)
나: 침묵 (협력)나 1년 / 상대 1년 ✅ 최선의 사회적 결과나 5년 / 상대 석방 ❌ 최악
나: 자백 (배신)나 석방 / 상대 5년 ⚡ 유혹나 3년 / 상대 3년 ⚠️ 내쉬 균형

상대방이 어떤 선택을 하더라도, 나에게 더 유리한 전략을 우월 전략이라 합니다. 죄수의 딜레마에서 ‘자백’은 양 당사자 모두에게 우월 전략입니다. 따라서 두 합리적 플레이어는 모두 자백을 선택해 서로 3년형이라는 사회적 최적보다 나쁜 결과에 도달합니다.


🎲 Game Theory Playground (Interactive Module Placeholder)

2. 내쉬 균형 (Nash Equilibrium)

존 내쉬(John Nash)가 1950년 프린스턴 박사논문에서 제시한 내쉬 균형은 모든 플레이어가 상대방의 전략을 알고 있을 때, 아무도 자신의 전략을 바꿀 유인이 없는 상태입니다. 이 공로로 내쉬는 1994년 노벨 경제학상을 수상했습니다.

죄수의 딜레마에서 내쉬 균형은 (배신, 배신) — 사회적 최적인 **(협력, 협력)**과 다르다는 점이 이론의 핵심적 통찰입니다.

내쉬 균형과 사회적 최적의 괴리 — 다양한 예시
상황개인 합리적 선택집단 최적결과의 괴리
죄수의 딜레마둘 다 자백 (3년형)둘 다 침묵 (1년형)2년씩 더 복역
군비 경쟁 (냉전)군사비 증강상호 군축과도한 군사 지출
교통 혼잡자가용 이용대중교통 이용교통 정체
어업 남획최대한 많이 어획지속 가능 어획수산 자원 고갈
광고 경쟁광고비 증가업계 광고 자제수익성 저하

3. 죄수의 딜레마를 깨는 방법

협력은 어떻게 가능할까요? **반복 게임(Repeated Games)**이 열쇠입니다.

1
반복 게임

한 번으로 끝나지 않는 관계에서는 배신의 미래 비용이 커져 협력이 합리적 선택이 됩니다.

2
평판 메커니즘

배신자로 알려지면 미래 협력 기회를 잃습니다. 장기 반복 게임에서 '팃포탯(Tit-for-Tat)' 전략이 강력합니다.

3
제도적 강제

규제, 계약, 법률로 배신에 패널티를 부여하면 협력이 우월 전략으로 바뀝니다.

4
소통과 신뢰

분리된 심문실 구조를 깸으로써(사전 소통 허용) 협조가 가능해집니다.

일상 생활(기후 변화 대응, 공용 냉장고 관리, 출퇴근 차선 선택)에서 ‘죄수의 딜레마’와 유사한 상황을 찾아보세요. 이 딜레마를 깨기 위해 어떤 제도적 장치가 필요할까요?

새 글 알림 받기

최신 글을 이메일로 받아보세요. 스팸 없음, 언제든 취소 가능.

구독하기 →
[object Object]

관련 글