Ch3. 확률분포 — 정규분포·이항분포·포아송 분포 완전 정복
확률분포의 종류
이산 확률분포: X가 셀 수 있는 값을 가짐 (동전 앞면 횟수)
연속 확률분포: X가 연속적인 값을 가짐 (키, 무게)
이항분포 (Binomial Distribution)
조건:
- n번의 독립적인 시행
- 각 시행은 성공(p) 또는 실패(1-p)만 존재
- 성공 확률 p는 매 시행 동일
X ~ B(n, p)
P(X = k) = C(n,k) × pᵏ × (1-p)ⁿ⁻ᵏ
기댓값 E(X) = np
분산 Var(X) = np(1-p)
예시: 주사위 10번 던질 때 1이 나오는 횟수
→ B(10, 1/6), E(X) = 10/6 ≈ 1.67
n이 크고 p가 작으면: 포아송 분포로 근사 (λ = np)
포아송 분포 (Poisson Distribution)
단위 시간(또는 공간)에 발생하는 사건 횟수의 분포.
조건:
- 사건이 독립적으로 무작위로 발생
- 평균 발생률 λ가 일정
X ~ Poisson(λ)
P(X = k) = (e⁻λ × λᵏ) / k!
E(X) = Var(X) = λ
활용: 1시간에 도착하는 고객 수, 1000개 제품 중 불량품 수
정규분포 (Normal Distribution)
통계학에서 가장 중요한 연속 확률분포.
X ~ N(μ, σ²)
f(x) = (1/√(2πσ²)) × exp(-(x-μ)²/2σ²)
특징:
- 평균 μ를 중심으로 좌우 대칭
- 평균 = 중앙값 = 최빈값
- σ(표준편차)가 클수록 넓게 퍼짐
- 전체 면적 = 1
경험적 규칙 (68-95-99.7 법칙)
μ ± 1σ 범위: 약 68.27%
μ ± 2σ 범위: 약 95.45%
μ ± 3σ 범위: 약 99.73%
표준정규분포와 Z-점수
표준화(Standardization):
Z = (X - μ) / σ
Z ~ N(0, 1) (표준정규분포)
Z-점수의 의미: 원래 값이 평균으로부터 표준편차의 몇 배 떨어져 있는지.
예시: 수능 평균 50점, 표준편차 10점
70점을 받은 학생의 Z-점수 = (70-50)/10 = 2.0
→ 평균보다 2 표준편차 위 = 상위 약 2.3%
활용:
- 다른 단위의 변수 비교 (키 vs 몸무게)
- 이상치 탐지 (|Z| > 3: 극단값)
- 확률 계산 (표준정규분포표 이용)
지수분포 (Exponential Distribution)
포아송 과정에서 사건 간 대기 시간의 분포.
X ~ Exp(λ)
E(X) = 1/λ (평균 대기 시간)
Var(X) = 1/λ²
무기억성(Memoryless Property): P(X>s+t|X>s) = P(X>t)
활용: 전자기기 수명, 고객 서비스 대기 시간
핵심 개념 카드
정규분포 68-95-99.7 법칙 ★★★★★ : μ±1σ=68%, μ±2σ=95%, μ±3σ=99.7%. 품질관리·통계 검정의 기본 기준. 암기 포인트: 1σ=68, 2σ=95, 3σ=99.7
Z-점수(표준화) ★★★★★ : Z = (X-μ)/σ. 원점수를 표준정규분포로 변환. 단위 다른 데이터 비교 가능. 암기 포인트: Z = 편차 ÷ 표준편차
이항분포 기댓값 ★★★★☆ : E(X) = np, Var(X) = np(1-p). n번 시행, 성공 확률 p. 암기 포인트: 기댓값 = 시행 수 × 성공 확률
실전 퀴즈
Q. 어떤 시험의 점수가 N(70, 100)을 따를 때, 80점 이상 받을 확률은? (Z=1.0 → 누적확률 84.1%)
Z = (80-70)/10 = 1.0. P(X≥80) = 1 - 0.841 = 0.159 = 약 15.9%.
Q. 포아송 분포와 이항분포의 관계는?
n이 크고(시행 많음) p가 작을(성공률 낮음) 때 이항분포 B(n,p)는 λ=np인 포아송 분포로 근사. 예: 불량품, 희귀 사건 모델링.
OIYO 편집부
Content Editor지식 인큐베이터이자 전문 콘텐츠 크리에이터. 경영, 경제, 법률 및 실생활에 유용한 실무/자격증 중심의 깊이 있는 정보를 연구하고 공유합니다.