강의 챕터 4 약 2분

Ch4. 표본분포와 중심극한정리 — 표본으로 모집단을 추론하는 원리

O
OIYO 편집부 기여자
4/10

모집단과 표본

모집단(Population): 연구 대상이 되는 전체 집합
표본(Sample): 모집단의 일부를 선택한 것

왜 표본을 사용하는가?

  • 모집단 전수 조사는 비용·시간상 불가능
  • 표본으로 모집단 특성을 추론(inference)

모수(Parameter): 모집단의 특성값 (μ, σ)
통계량(Statistic): 표본에서 계산한 값 (x̄, s)


표본 추출 방법

방법설명
단순 무작위 추출모든 개체 동등한 선택 확률
층화 추출층(계층) 나눠 각 층에서 추출
군집 추출집단(군집) 선택 후 내부 전수 조사
계통 추출첫 개체 무작위 선택 후 일정 간격으로 추출

표본평균의 분포

같은 모집단에서 크기 n인 표본을 반복해서 추출할 때, 표본평균 x̄는 분포를 가집니다.

모집단: μ, σ²이라 할 때

표본평균 x̄ ~ N(μ, σ²/n)

기댓값: E(x̄) = μ
분산:   Var(x̄) = σ²/n
표준오차: SE = σ/√n

핵심: 표본 크기 n이 커질수록 표본평균의 변동(표준오차)이 작아짐.


중심극한정리 (Central Limit Theorem, CLT)

통계학에서 가장 중요한 정리.

모집단의 분포에 관계없이, n이 충분히 크면(보통 n ≥ 30) 표본평균의 분포는 정규분포에 근사한다.

x̄ ~ N(μ, σ²/n)  (n이 충분히 클 때)

표준화: Z = (x̄ - μ) / (σ/√n)

의미: 모집단이 정규분포가 아니어도 (균일분포, 이항분포 등) 표본이 크면 표본평균은 정규분포를 따름.


표준오차 (Standard Error, SE)

SE = σ/√n  (모표준편차 알 때)
SE = s/√n  (표본표준편차 추정)

표준편차 vs 표준오차:

  • 표준편차: 개별 데이터의 변동성
  • 표준오차: 표본평균의 변동성 (정확도)

n이 4배가 되면 표준오차는 절반으로 줄어듦.


표본 비율의 분포

표본 비율 p̂ = 표본 성공 횟수 / n

기댓값: E(p̂) = p
분산:   Var(p̂) = p(1-p)/n
표준오차: √[p(1-p)/n]

CLT에 의해 n이 크면 p̂는 정규분포에 근사.


핵심 개념 카드

중심극한정리(CLT) ★★★★★ : 모집단 분포 무관하게 n≥30이면 표본평균은 N(μ, σ²/n)에 근사. 통계적 추론의 근거. 암기 포인트: n이 크면 표본평균 → 정규분포

표준오차(SE) ★★★★★ : 표본평균의 표준편차. SE = σ/√n. n이 클수록 SE 작아짐 → 추정 정확도 향상. 암기 포인트: SE = σ/√n, n 4배 → SE 절반

모수 vs 통계량 ★★★★☆ : 모수(μ, σ)는 고정된 모집단 값. 통계량(x̄, s)은 표본마다 달라지는 추정값. 암기 포인트: 모수=모집단, 통계량=표본


실전 퀴즈

Q. 표준편차 15인 모집단에서 n=225인 표본의 표준오차는?

SE = 15/√225 = 15/15 = 1. 표본평균의 변동이 표준편차 1 수준으로 줄어듦.

Q. 모집단이 오른쪽 편포를 가진다. n=50인 표본평균의 분포는?

중심극한정리에 의해 n=50이면 모집단 분포에 무관하게 표본평균의 분포는 정규분포에 근사. 기댓값 = 모평균, 표준편차 = 모표준편차/√50.

O

OIYO 편집부

Content Editor

지식 인큐베이터이자 전문 콘텐츠 크리에이터. 경영, 경제, 법률 및 실생활에 유용한 실무/자격증 중심의 깊이 있는 정보를 연구하고 공유합니다.