Ch8. 분산분석(ANOVA) — 세 집단 이상의 평균 차이 검정
왜 ANOVA가 필요한가
세 집단 이상의 평균을 비교할 때 t 검정을 반복하면 1종 오류 누적 문제가 생깁니다.
3집단 비교 시 t 검정 3번:
P(적어도 1개 오류) = 1 - (0.95)³ ≈ 14.3% (α=0.05여도 실제 오류율 14%)
ANOVA(Analysis of Variance): 한 번의 검정으로 모든 집단 평균 동시 비교.
일원분산분석 (One-Way ANOVA)
가설:
H₀: μ₁ = μ₂ = ... = μₖ (모든 집단 평균 같음)
H₁: 적어도 하나의 평균이 다름
기본 아이디어:
전체 변동 = 집단 간 변동 + 집단 내 변동
SST = SSB + SSW
| 변동 원천 | 제곱합 | 자유도 | 평균제곱 |
|---|---|---|---|
| 집단 간(Between) | SSB | k-1 | MSB = SSB/(k-1) |
| 집단 내(Within) | SSW | N-k | MSW = SSW/(N-k) |
| 전체(Total) | SST | N-1 |
F 통계량:
F = MSB / MSW ~ F(k-1, N-k)
F > F_α (기각값)이면 H₀ 기각
ANOVA의 가정
- 각 집단이 정규분포
- 집단 간 분산 동일 (등분산성)
- 관측값이 독립
사후 검정 (Post-Hoc Test)
ANOVA로 H₀를 기각한 후 어떤 집단 간 차이가 있는지 확인.
| 방법 | 특징 |
|---|---|
| Tukey HSD | 집단 크기 같을 때 권장 |
| Bonferroni | 다중 비교 조정, 보수적 |
| Scheffe | 가장 보수적, 모든 비교 |
| Duncan | 덜 엄격, 쌍별 비교 |
카이제곱 검정 (Chi-Square Test)
범주형 데이터 분석에 활용.
독립성 검정
두 범주형 변수가 서로 독립인지 검정.
H₀: 두 변수는 독립
H₁: 두 변수는 독립이 아님
χ² = Σ[(관측값 - 기대값)² / 기대값]
자유도: (행-1) × (열-1)
예시: 성별과 직업 만족도의 관계
적합도 검정
관측된 분포가 이론적 분포와 일치하는지 검정.
비모수 검정
정규성 가정이 충족되지 않을 때 대안.
| 상황 | 모수 검정 | 비모수 대안 |
|---|---|---|
| 2집단 비교 | t 검정 | Mann-Whitney U |
| 3집단+ 비교 | ANOVA | Kruskal-Wallis |
| 대응 표본 | 대응 t 검정 | Wilcoxon |
핵심 개념 카드
ANOVA F통계량 ★★★★★ : F = 집단 간 변동 / 집단 내 변동. F가 크면 집단 간 차이가 집단 내 변동보다 큼 → H₀ 기각. 암기 포인트: F = MSB/MSW, 클수록 집단 간 차이 유의
카이제곱 독립성 검정 ★★★★★ : 두 범주형 변수의 독립성 검정. χ² = Σ(관측-기대)²/기대. 암기 포인트: 카이제곱 = 범주형 데이터의 독립성
사후 검정 ★★★★☆ : ANOVA 후 어떤 집단 쌍이 다른지 확인. Tukey·Bonferroni·Scheffe 등 방법 선택. 암기 포인트: ANOVA → 사후검정 → 구체적 집단 쌍 비교
실전 퀴즈
Q. 3가지 교육 방법 A·B·C의 시험 평균을 비교하고 싶다. 어떤 검정을 쓰나?
일원 ANOVA. H₀: μA=μB=μC. F통계량으로 전체 차이 검정 후, 유의하면 Tukey 등 사후검정으로 구체적 쌍별 비교.
Q. 성별(남/여)과 구매 여부(예/아니오)의 관계 검정에는 어떤 방법을?
카이제곱 독립성 검정. 2×2 분할표 작성 후 χ²통계량 계산, 자유도 (2-1)×(2-1)=1.
OIYO 편집부
Content Editor지식 인큐베이터이자 전문 콘텐츠 크리에이터. 경영, 경제, 법률 및 실생활에 유용한 실무/자격증 중심의 깊이 있는 정보를 연구하고 공유합니다.