강의 챕터 10 약 3분

Ch10. 통계학 실전 종합 — 공무원·경영 시험 핵심 정리

O
OIYO 편집부 기여자
10/10

통계학 전체 흐름 요약

데이터 수집 → 기술통계(요약) → 확률 이론 → 추론통계
    ↓              ↓                ↓           ↓
표본 설계    평균·표준편차    확률분포·CLT   추정·검정

시험 빈출 공식 모음

중심경향 및 산포

산술평균:     x̄ = Σxᵢ / n
분산(표본):   s² = Σ(xᵢ-x̄)² / (n-1)
표준편차:     s = √s²
변동계수:     CV = s/x̄ × 100%

확률 기본

덧셈법칙: P(A∪B) = P(A)+P(B)-P(A∩B)
곱셈법칙: P(A∩B) = P(A)×P(B|A)
조건부:   P(A|B) = P(A∩B)/P(B)
독립조건: P(A∩B) = P(A)×P(B)

주요 확률분포

이항분포:   E(X)=np, Var(X)=np(1-p)
포아송분포: E(X)=Var(X)=λ
정규분포:   X~N(μ,σ²) → Z=(X-μ)/σ~N(0,1)
t분포:      t=(x̄-μ₀)/(s/√n), df=n-1

추정 및 검정

표준오차:      SE = σ/√n
95% 신뢰구간:  x̄ ± 1.96 × σ/√n
99% 신뢰구간:  x̄ ± 2.576 × σ/√n
Z검정통계량:   Z = (x̄-μ₀) / (σ/√n)
F통계량:       F = MSB/MSW
카이제곱:      χ² = Σ(O-E)²/E

회귀분석

회귀계수:  β₁ = r × (sy/sx)
절편:      β₀ = ȳ - β₁x̄
결정계수:  R² = SSR/SST = 1-SSE/SST

핵심 수치 암기

구분
표준정규 Z₀.₀₂₅1.96
표준정규 Z₀.₀₀₅2.576
표준정규 Z₀.₀₅1.645
68-95-99.7%±1σ, ±2σ, ±3σ
이항→포아송 근사n≥30, p≤0.05, λ=np

자주 나오는 오류와 함정

1. 상관관계를 인과관계로 혼동

아이스크림 판매량↑ → 익사 사고↑ (공통 원인: 여름)

2. p값의 잘못된 해석

p=0.03은 H₀가 참일 확률이 3%가 아님
→ H₀ 하에서 이런 데이터가 관측될 확률

3. 통계적 유의성 ≠ 실질적 중요성

n이 매우 크면 작은 차이도 통계적으로 유의
→ 효과 크기(Cohen’s d, η²) 함께 보고

4. 생존 편향(Survivorship Bias)

성공한 기업만 분석 → 실패 사례 누락으로 왜곡

5. 소집단에서의 극단값

작은 표본에서 이상치가 평균에 큰 영향 → 중앙값 사용


통계학의 실무 활용

품질 관리

6시그마: 불량률 < 3.4ppm (μ±6σ 이내)
공정능력지수 Cp = (규격 상한 - 규격 하한) / 6σ

A/B 테스트

두 버전(A, B)의 성과를 통계적으로 비교. 웹사이트 전환율, 광고 효과 측정.

t검정 또는 Z검정으로 두 비율/평균 차이 검정
충분한 표본 크기 확보 → 통계적 검정력 보장

경제지표 해석

  • GDP 성장률: 전년 동기 대비 % 변화 (계절 조정)
  • 소비자물가지수: 기준 연도 대비 물가 수준
  • 실업률: 경제활동인구 중 실업자 비율

핵심 개념 카드

중심극한정리(복습) ★★★★★ : 모집단 무관하게 n≥30이면 표본평균은 정규분포에 근사. 통계적 추론의 근거. 암기 포인트: CLT = 통계학의 가장 중요한 정리

통계적 유의성의 한계 ★★★★★ : p<0.05가 실질적 의미를 보장하지 않음. 효과 크기와 함께 해석 필요. 암기 포인트: 유의 ≠ 중요, 표본이 크면 작은 차이도 유의

생존 편향 ★★★★☆ : 관찰 가능한 사례(살아남은 것)만 분석하여 결론이 왜곡되는 오류. 암기 포인트: 2차대전 돌아온 비행기만 분석 → 총알 구멍 위치 오판


실전 퀴즈

Q. 어떤 온라인 강의가 평균 만족도 7.2점(σ=1.5, n=400)이다. 모평균의 95% 신뢰구간은?

SE = 1.5/√400 = 0.075. 95% CI = 7.2 ± 1.96×0.075 = [7.053, 7.347].

Q. 두 마케팅 방법의 클릭률이 A=5.2%(n₁=1000), B=5.8%(n₂=1000)이다. 통계적으로 유의한 차이인가?

합동 표준오차 사용한 Z검정. 차이=0.006, SE=√[0.052×0.948/1000 + 0.058×0.942/1000]≈0.0070. Z≈0.857. p>0.05 → 통계적으로 유의하지 않음 (표본이 충분히 크지 않거나 차이가 작음).

O

OIYO 편집부

Content Editor

지식 인큐베이터이자 전문 콘텐츠 크리에이터. 경영, 경제, 법률 및 실생활에 유용한 실무/자격증 중심의 깊이 있는 정보를 연구하고 공유합니다.