Ch6. 가설검정 — 데이터로 주장의 진실을 검증하는 방법

가설검정이란

가설검정(Hypothesis Testing): 표본 데이터를 바탕으로 모집단에 대한 주장(가설)이 맞는지 통계적으로 판단하는 절차.

귀무가설 H₀ (Null Hypothesis): 기존의 주장, 차이 없음, 변화 없음
대립가설 H₁ (Alternative Hypothesis): 새로운 주장, 차이 있음, 변화 있음

예시: 신약의 효과 검정
H₀: 신약 효과 없음 (평균 개선 = 0)
H₁: 신약 효과 있음 (평균 개선 ≠ 0)

단측 검정 vs 양측 검정:

유의수준(α, Significance Level): H₀가 참인데도 기각할 최대 허용 확률

기각역: 검정통계량이 이 범위에 들면 H₀ 기각

양측 검정, α=0.05:
기각역: Z < -1.96 또는 Z > 1.96
채택역: -1.96 ≤ Z ≤ 1.96

p값: H₀가 참이라고 가정할 때, 관측된 것만큼 극단적인 결과가 나올 확률

p값 < α → H₀ 기각 ("통계적으로 유의하다")
p값 ≥ α → H₀ 기각하지 않음

주의: p값은 H₀이 참일 확률이 아님.
→ p=0.03은 “H₀ 하에서 이런 데이터가 관측될 확률이 3%“

	H₀ 기각	H₀ 채택
H₀ 참	1종 오류(α)	올바른 결정
H₀ 거짓	올바른 결정	2종 오류(β)

1종 오류(Type I): 무고한 사람을 유죄 판결 (= 유의수준 α)
2종 오류(Type II): 유죄인 사람을 무죄 판결 (= β)
검정력(Power) = 1 - β: H₀가 거짓일 때 올바르게 기각할 확률

α를 줄이면 β가 증가하는 트레이드오프 관계.

모표준편차 σ를 아는 경우 또는 n이 큰 경우.

Z = (x̄ - μ₀) / (σ/√n)

σ를 모를 때, 소표본.

t = (x̄ - μ₀) / (s/√n)   (자유도: n-1)

두 집단 평균 비교.

t = (x̄₁ - x̄₂) / √[s₁²/n₁ + s₂²/n₂]

p값 ★★★★★ : H₀가 참일 때 관측 데이터만큼 극단적인 결과가 나올 확률. p<0.05이면 H₀ 기각. 암기 포인트: p값 < α → 귀무가설 기각

1종 vs 2종 오류 ★★★★★ : 1종=참인 H₀ 기각(α), 2종=거짓인 H₀ 채택(β). α를 엄격히 하면 β 증가. 암기 포인트: 1종=무고한 유죄, 2종=유죄한 무죄

검정력(1-β) ★★★★☆ : 실제로 차이가 있을 때 그것을 탐지할 확률. 표본 크기가 클수록 검정력 향상. 암기 포인트: 검정력 = 1 - 2종 오류 확률

Q. 새로운 교육 방법의 효과를 검정한다. 어떤 오류가 더 위험한가?

문맥에 따라 다름. 효과 없는 방법을 효과 있다고 잘못 결론(1종 오류)하면 교육비 낭비. 효과 있는 방법을 놓치면(2종 오류) 더 나은 교육 기회 상실. 비용과 위험에 따라 α 설정.

Q. 같은 실험에서 α=0.05에서는 H₀를 기각했고 α=0.01에서는 기각 못 했다. p값의 범위는?

0.01 ≤ p값 < 0.05. α=0.05보다 작아서 기각되었으나 α=0.01보다는 크므로 기각 안 됨.