Ch6. 가설검정 — 데이터로 주장의 진실을 검증하는 방법
가설검정이란
가설검정(Hypothesis Testing): 표본 데이터를 바탕으로 모집단에 대한 주장(가설)이 맞는지 통계적으로 판단하는 절차.
가설의 종류
귀무가설 H₀ (Null Hypothesis): 기존의 주장, 차이 없음, 변화 없음
대립가설 H₁ (Alternative Hypothesis): 새로운 주장, 차이 있음, 변화 있음
예시: 신약의 효과 검정
H₀: 신약 효과 없음 (평균 개선 = 0)
H₁: 신약 효과 있음 (평균 개선 ≠ 0)
단측 검정 vs 양측 검정:
- 양측: H₁: μ ≠ μ₀ (크거나 작은 경우 모두)
- 우측 단측: H₁: μ > μ₀
- 좌측 단측: H₁: μ < μ₀
가설검정 절차
- 귀무가설·대립가설 설정
- 유의수준(α) 설정 (보통 0.05 또는 0.01)
- 검정통계량 계산
- 기각역 또는 p값 결정
- 귀무가설 기각 여부 결정
- 결론 도출
유의수준과 기각역
유의수준(α, Significance Level): H₀가 참인데도 기각할 최대 허용 확률
기각역: 검정통계량이 이 범위에 들면 H₀ 기각
양측 검정, α=0.05:
기각역: Z < -1.96 또는 Z > 1.96
채택역: -1.96 ≤ Z ≤ 1.96
p값 (p-value)
p값: H₀가 참이라고 가정할 때, 관측된 것만큼 극단적인 결과가 나올 확률
p값 < α → H₀ 기각 ("통계적으로 유의하다")
p값 ≥ α → H₀ 기각하지 않음
주의: p값은 H₀이 참일 확률이 아님.
→ p=0.03은 “H₀ 하에서 이런 데이터가 관측될 확률이 3%“
1종 오류와 2종 오류
| H₀ 기각 | H₀ 채택 | |
|---|---|---|
| H₀ 참 | 1종 오류(α) | 올바른 결정 |
| H₀ 거짓 | 올바른 결정 | 2종 오류(β) |
1종 오류(Type I): 무고한 사람을 유죄 판결 (= 유의수준 α)
2종 오류(Type II): 유죄인 사람을 무죄 판결 (= β)
검정력(Power) = 1 - β: H₀가 거짓일 때 올바르게 기각할 확률
α를 줄이면 β가 증가하는 트레이드오프 관계.
주요 검정 방법
Z 검정
모표준편차 σ를 아는 경우 또는 n이 큰 경우.
Z = (x̄ - μ₀) / (σ/√n)
t 검정 (Student’s t-test)
σ를 모를 때, 소표본.
t = (x̄ - μ₀) / (s/√n) (자유도: n-1)
독립 2표본 t 검정
두 집단 평균 비교.
t = (x̄₁ - x̄₂) / √[s₁²/n₁ + s₂²/n₂]
핵심 개념 카드
p값 ★★★★★ : H₀가 참일 때 관측 데이터만큼 극단적인 결과가 나올 확률. p<0.05이면 H₀ 기각. 암기 포인트: p값 < α → 귀무가설 기각
1종 vs 2종 오류 ★★★★★ : 1종=참인 H₀ 기각(α), 2종=거짓인 H₀ 채택(β). α를 엄격히 하면 β 증가. 암기 포인트: 1종=무고한 유죄, 2종=유죄한 무죄
검정력(1-β) ★★★★☆ : 실제로 차이가 있을 때 그것을 탐지할 확률. 표본 크기가 클수록 검정력 향상. 암기 포인트: 검정력 = 1 - 2종 오류 확률
실전 퀴즈
Q. 새로운 교육 방법의 효과를 검정한다. 어떤 오류가 더 위험한가?
문맥에 따라 다름. 효과 없는 방법을 효과 있다고 잘못 결론(1종 오류)하면 교육비 낭비. 효과 있는 방법을 놓치면(2종 오류) 더 나은 교육 기회 상실. 비용과 위험에 따라 α 설정.
Q. 같은 실험에서 α=0.05에서는 H₀를 기각했고 α=0.01에서는 기각 못 했다. p값의 범위는?
0.01 ≤ p값 < 0.05. α=0.05보다 작아서 기각되었으나 α=0.01보다는 크므로 기각 안 됨.
OIYO 편집부
Content Editor지식 인큐베이터이자 전문 콘텐츠 크리에이터. 경영, 경제, 법률 및 실생활에 유용한 실무/자격증 중심의 깊이 있는 정보를 연구하고 공유합니다.