제2강: 내쉬 균형 심화 — 혼합 전략과 다중 균형
순수 전략의 한계
1강에서 죄수의 딜레마는 순수 전략 내쉬 균형이 명확했습니다. 하지만 많은 게임에서 순수 전략만으로는 균형이 존재하지 않습니다.
| 나 \ 상대 | 앞면 | 뒷면 |
|---|---|---|
| 앞면 | 나 +1, 상대 -1 | 나 -1, 상대 +1 |
| 뒷면 | 나 -1, 상대 +1 | 나 +1, 상대 -1 |
내가 앞면을 선택하면 상대는 뒷면을 선택하고, 내가 뒷면을 선택하면 상대는 앞면을 선택합니다. 어느 순수 전략 조합도 안정적이지 않습니다. 이런 게임의 해답이 혼합 전략입니다.
혼합 전략 내쉬 균형
혼합 전략이란 각 순수 전략을 특정 확률로 선택하는 것입니다.
| 개념 | 설명 | 예시 |
|---|---|---|
| 혼합 전략 | 순수 전략을 확률적으로 선택 | 앞면 50%, 뒷면 50% |
| 균형 조건 | 상대가 내 혼합 전략에 무차별해야 함 | 상대 기대보수가 전략 간 동일 |
| 이탈 유인 없음 | 어떤 순수 전략을 써도 기대보수 같음 | 예측 불가능성이 핵심 |
동전 맞추기 혼합 전략 균형:
→ 양측 모두 앞면 50%, 뒷면 50% 선택
→ 상대 입장에서 내 전략 예측 불가
→ 기대보수 = 0 (균형)
핵심 통찰:
→ 상대가 내 전략을 활용할 수 없도록
예측 불가능성을 만드는 것이 합리적
현실 속 혼합 전략
| 상황 | 혼합 전략의 역할 | 순수 전략의 문제 |
|---|---|---|
| 축구 패널티킥 | 키커: 왼쪽/오른쪽 무작위 선택 | 항상 같은 방향 → 상대가 예측 |
| 세금 감사 | 국세청: 일부 납세자를 무작위 감사 | 항상 같은 기준 → 탈세 최적화 |
| 군사 순찰 | 보안군: 순찰 경로 무작위화 | 고정 경로 → 적이 학습 |
| 포커 | 블러핑 확률 최적화 | 항상/절대 블러핑 → 읽힘 |
다중 균형과 조율 게임
일부 게임에서는 내쉬 균형이 여러 개 존재합니다.
| 나 \ 상대 | 우측 통행 | 좌측 통행 |
|---|---|---|
| 우측 통행 | 둘 다 +1 ✅ 균형 1 | 둘 다 -1 ❌ |
| 좌측 통행 | 둘 다 -1 ❌ | 둘 다 +1 ✅ 균형 2 |
균형이 여러 개일 때 어떻게 하나를 선택할까요? 초점(Focal Point, Schelling Point) 이론이 답입니다. 문화·관습·법률·역사가 사람들의 기대를 조율하여 하나의 균형으로 수렴하게 합니다. 예를 들어 한국의 우측 통행은 법으로 강제되어 우월 균형이 됩니다.
| 사례 | 균형 1 | 균형 2 | 조율 메커니즘 |
|---|---|---|---|
| 통화 선택 | 달러 사용 | 유로 사용 | 역사·무역 관계 |
| 소프트웨어 표준 | 윈도우 생태계 | 맥 생태계 | 네트워크 효과 |
| 약속 장소 | 광화문 이순신 앞 | 서울역 | 문화적 초점 |
| 사회 규범 | 악수 | 절 | 문화·지역 |
균형 선택 이론
여러 균형 중 모든 참여자에게 더 유리한 균형이 있다면 그것이 선택됩니다. 파레토 우월 균형으로 수렴하는 경향이 있습니다.
불확실성이 높을 때는 '안전한' 균형을 선호합니다. 최악의 경우가 덜 나쁜 전략이 채택됩니다.
토머스 셸링의 개념. 사람들은 커뮤니케이션 없이도 문화·상식·맥락을 통해 같은 균형으로 수렴합니다.
게임이 반복될수록 경험을 통해 특정 균형으로 진화합니다. 진화 게임이론의 핵심 주제입니다.
핵심 암기 포인트
혼합 전략: 순수 전략 균형 없을 때 — 확률적 선택으로 예측 불가능성 확보 균형 조건: 상대가 내 혼합 전략에 무차별 → 기대보수 동일 다중 균형: 초점(Focal Point)이 하나의 균형으로 사람들을 조율 현실 적용: 패널티킥, 세금 감사, 포커 모두 혼합 전략 활용
OIYO 편집부
Content Editor지식 인큐베이터이자 전문 콘텐츠 크리에이터. 경영, 경제, 법률 및 실생활에 유용한 실무/자격증 중심의 깊이 있는 정보를 연구하고 공유합니다.