강의 챕터 8 약 3분

Ch8. 분산분석(ANOVA) — 세 집단 이상의 평균 차이 검정

O
OIYO 편집부 기여자
8/10

왜 ANOVA가 필요한가

세 집단 이상의 평균을 비교할 때 t 검정을 반복하면 1종 오류 누적 문제가 생깁니다.

3집단 비교 시 t 검정 3번:
P(적어도 1개 오류) = 1 - (0.95)³ ≈ 14.3% (α=0.05여도 실제 오류율 14%)

ANOVA(Analysis of Variance): 한 번의 검정으로 모든 집단 평균 동시 비교.


일원분산분석 (One-Way ANOVA)

가설:

H₀: μ₁ = μ₂ = ... = μₖ (모든 집단 평균 같음)
H₁: 적어도 하나의 평균이 다름

기본 아이디어:

전체 변동 = 집단 간 변동 + 집단 내 변동
SST      = SSB           + SSW
변동 원천제곱합자유도평균제곱
집단 간(Between)SSBk-1MSB = SSB/(k-1)
집단 내(Within)SSWN-kMSW = SSW/(N-k)
전체(Total)SSTN-1

F 통계량:

F = MSB / MSW ~ F(k-1, N-k)

F > F_α (기각값)이면 H₀ 기각

ANOVA의 가정

  1. 각 집단이 정규분포
  2. 집단 간 분산 동일 (등분산성)
  3. 관측값이 독립

사후 검정 (Post-Hoc Test)

ANOVA로 H₀를 기각한 후 어떤 집단 간 차이가 있는지 확인.

방법특징
Tukey HSD집단 크기 같을 때 권장
Bonferroni다중 비교 조정, 보수적
Scheffe가장 보수적, 모든 비교
Duncan덜 엄격, 쌍별 비교

카이제곱 검정 (Chi-Square Test)

범주형 데이터 분석에 활용.

독립성 검정

두 범주형 변수가 서로 독립인지 검정.

H₀: 두 변수는 독립
H₁: 두 변수는 독립이 아님

χ² = Σ[(관측값 - 기대값)² / 기대값]

자유도: (행-1) × (열-1)

예시: 성별과 직업 만족도의 관계

적합도 검정

관측된 분포가 이론적 분포와 일치하는지 검정.


비모수 검정

정규성 가정이 충족되지 않을 때 대안.

상황모수 검정비모수 대안
2집단 비교t 검정Mann-Whitney U
3집단+ 비교ANOVAKruskal-Wallis
대응 표본대응 t 검정Wilcoxon

핵심 개념 카드

ANOVA F통계량 ★★★★★ : F = 집단 간 변동 / 집단 내 변동. F가 크면 집단 간 차이가 집단 내 변동보다 큼 → H₀ 기각. 암기 포인트: F = MSB/MSW, 클수록 집단 간 차이 유의

카이제곱 독립성 검정 ★★★★★ : 두 범주형 변수의 독립성 검정. χ² = Σ(관측-기대)²/기대. 암기 포인트: 카이제곱 = 범주형 데이터의 독립성

사후 검정 ★★★★☆ : ANOVA 후 어떤 집단 쌍이 다른지 확인. Tukey·Bonferroni·Scheffe 등 방법 선택. 암기 포인트: ANOVA → 사후검정 → 구체적 집단 쌍 비교


실전 퀴즈

Q. 3가지 교육 방법 A·B·C의 시험 평균을 비교하고 싶다. 어떤 검정을 쓰나?

일원 ANOVA. H₀: μA=μB=μC. F통계량으로 전체 차이 검정 후, 유의하면 Tukey 등 사후검정으로 구체적 쌍별 비교.

Q. 성별(남/여)과 구매 여부(예/아니오)의 관계 검정에는 어떤 방법을?

카이제곱 독립성 검정. 2×2 분할표 작성 후 χ²통계량 계산, 자유도 (2-1)×(2-1)=1.

O

OIYO 편집부

Content Editor

지식 인큐베이터이자 전문 콘텐츠 크리에이터. 경영, 경제, 법률 및 실생활에 유용한 실무/자격증 중심의 깊이 있는 정보를 연구하고 공유합니다.