Ch5. 통계적 추정 — 신뢰구간으로 모수를 구간 추정하는 법
통계적 추정이란
추정(Estimation): 표본 데이터를 이용해 모집단의 모수(μ, σ, p)를 추측하는 과정.
점추정(Point Estimation): 하나의 숫자로 모수 추정 (예: 표본평균 x̄로 모평균 μ 추정)
구간추정(Interval Estimation): 모수가 포함될 구간을 추정 (예: 95% 신뢰구간)
좋은 추정량의 조건
| 특성 | 의미 |
|---|---|
| 불편성(Unbiasedness) | E(추정량) = 모수 (편향 없음) |
| 효율성(Efficiency) | 같은 표본 크기에서 분산이 최소 |
| 일관성(Consistency) | n→∞일 때 추정량이 모수에 수렴 |
| 충분성(Sufficiency) | 추정에 필요한 모든 정보 활용 |
표본분산 s² = Σ(xᵢ-x̄)²/(n-1): 분모가 n이 아닌 n-1인 이유 → 불편추정량 만족
신뢰구간 (Confidence Interval)
신뢰구간: 모수가 포함될 것으로 기대되는 구간
잘못된 해석: “모평균이 95% 확률로 이 구간 안에 있다”
올바른 해석: “같은 방법으로 100번 구간 추정하면 약 95번은 모평균을 포함한다”
모평균의 신뢰구간
σ(모표준편차)를 아는 경우 (Z 분포):
신뢰구간 = x̄ ± Zα/2 × (σ/√n)
95% 신뢰구간: Z₀.₀₂₅ = 1.96
99% 신뢰구간: Z₀.₀₀₅ = 2.576
σ를 모르는 경우 (t 분포, 소표본):
신뢰구간 = x̄ ± t(α/2, n-1) × (s/√n)
모비율의 신뢰구간
p̂ ± Zα/2 × √[p̂(1-p̂)/n]
신뢰수준과 신뢰구간의 관계
| 신뢰수준 | Z값 | 구간 넓이 |
|---|---|---|
| 90% | 1.645 | 좁음 |
| 95% | 1.960 | 보통 |
| 99% | 2.576 | 넓음 |
신뢰수준 높이면: 구간이 넓어짐 (정확도↑, 정밀도↓)
표본 크기 늘리면: 구간이 좁아짐 (정밀도↑)
표본 크기 결정
원하는 오차 한계(margin of error, E)를 달성하기 위한 최소 표본 크기:
n ≥ (Zα/2 × σ / E)²
모비율 추정:
n ≥ (Zα/2)² × p̂(1-p̂) / E²
(p̂ 모를 때: p̂=0.5 대입 → 최대 표본 크기)
예시: 95% 신뢰수준, σ=10, 오차한계 E=2이면
n ≥ (1.96 × 10 / 2)² = 9.8² = 96.04 → n = 97
핵심 개념 카드
95% 신뢰구간의 의미 ★★★★★ : 같은 방법으로 100번 구간 추정 시 95번은 모수를 포함. 특정 구간에 모수가 있을 확률 95%가 아님. 암기 포인트: 신뢰구간 = 장기 빈도적 해석
표본분산 분모 n-1 ★★★★☆ : n으로 나누면 편향(과소추정). n-1로 나누면 불편추정량. 자유도 개념. 암기 포인트: 표본분산 = n-1로 나눔 (불편성)
신뢰수준 높이면 구간 넓어짐 ★★★★☆ : 99% 구간이 95% 구간보다 넓음. 정확하게 포함하려면 더 넓은 그물 필요. 암기 포인트: 신뢰수준↑ → 구간↑ → 정밀도↓
실전 퀴즈
Q. n=100, x̄=50, σ=20일 때 95% 신뢰구간은?
SE = 20/√100 = 2. 95% 신뢰구간 = 50 ± 1.96×2 = [46.08, 53.92].
Q. 95% 신뢰구간에서 오차한계를 절반으로 줄이려면 표본 크기를 어떻게 해야 하는가?
E ∝ 1/√n이므로 오차를 절반으로 → n을 4배로 늘려야 한다.
OIYO 편집부
Content Editor지식 인큐베이터이자 전문 콘텐츠 크리에이터. 경영, 경제, 법률 및 실생활에 유용한 실무/자격증 중심의 깊이 있는 정보를 연구하고 공유합니다.