가설검정 — 귀무가설·p값·검정력·Z·t·F·χ² 검정 | 학습 위키

가설검정이란?

표본 데이터를 근거로 모집단에 대한 주장(가설)이 옳은지 판단하는 통계적 절차입니다.

예: "A 공정 개선 후 불량률이 줄었다" → 데이터로 검증 가능한가?
   "두 공급업체의 부품 강도에 차이가 있는가?"

검정은 항상 두 가설의 대결입니다.

1. 귀무가설과 대립가설

구분	기호	의미	특징
귀무가설 (Null Hypothesis)	H₀	"차이 없음", "변화 없음"	기본 전제, 검정으로 기각 시도
대립가설 (Alternative Hypothesis)	H₁ (또는 Hₐ)	"차이 있음", "개선됨"	연구자가 증명하고 싶은 내용

가설 설정 원칙

"증명하고 싶은 것"을 대립가설(H₁) 로 설정합니다.
귀무가설은 그 반대(현상 유지)로 자동 결정됩니다.

예시:

연구 질문	H₀	H₁
개선 후 평균이 달라졌나?	μ = μ₀	μ ≠ μ₀ (양측)
불량률이 줄었나?	p ≥ p₀	p < p₀ (단측)
두 공장 분산이 같나?	σ₁² = σ₂²	σ₁² ≠ σ₂² (양측)

2. 오류 유형과 유의수준

두 가지 판정 오류

	H₀ 사실	H₁ 사실
H₀ 채택	✓ 올바른 판정	β 오류 (2종 오류, 놓침)
H₀ 기각	α 오류 (1종 오류, 오경보)	✓ 올바른 판정

α (유의수준): H₀이 사실인데 기각할 확률 — 연구자가 미리 설정 (보통 0.05)
β: H₁이 사실인데 H₀을 채택할 확률 — 작을수록 좋음
검정력 (Power) = 1 - β: 실제 차이가 있을 때 올바르게 기각하는 능력

💡 샘플링 검사와 비교: α = 생산자위험, β = 소비자위험과 같은 구조입니다.

유의수준 선택 기준

α	사용 상황
0.10	탐색적 연구, 1차 스크리닝
0.05	일반 품질 연구 (가장 많이 사용)
0.01	안전·의료·중요 공정 변경

3. p값 (p-value)

p값: 귀무가설이 사실이라고 가정했을 때, 현재 표본 결과(또는 더 극단적인 결과)가 나올 확률

p값 ≤ α  →  H₀ 기각 (통계적으로 유의함)
p값 > α  →  H₀ 채택 (증거 불충분)

직관적 해석:

p = 0.03이고 α = 0.05: "H₀이 사실이라면 이런 데이터가 나올 확률 3% → 희박 → H₀ 기각"
p = 0.15이고 α = 0.05: "이런 데이터가 나올 확률 15% → 충분히 가능 → H₀ 유지"

⚠️ 흔한 오해: p값은 "H₀이 맞을 확률"이 아닙니다. H₀이 사실임을 가정했을 때 데이터가 나올 확률입니다.

4. 단측 검정 vs 양측 검정

양측 검정 (Two-tailed): H₁: μ ≠ μ₀
  기각역이 양쪽에 α/2씩 분포
  → "방향 무관, 차이만 있으면 된다"

단측 검정 (One-tailed): H₁: μ > μ₀  또는  H₁: μ < μ₀
  기각역이 한쪽에 α 전부 집중
  → "방향이 중요, 개선됐는지 확인"

상황	선택	이유
단순히 차이 확인	양측	방향 모름
개선 여부 확인	단측	방향 명확
규격 초과 여부	단측	방향 명확

💡 주의: 데이터를 보고 나서 단측을 선택하면 안 됩니다. 사전에 결정해야 합니다.

5. 검정 절차 (5단계)

1단계: 가설 설정
   H₀: μ = 50,  H₁: μ ≠ 50

2단계: 유의수준 설정
   α = 0.05

3단계: 검정 통계량 계산
   Z = (x̄ - μ₀) / (σ/√n)  또는  t = (x̄ - μ₀) / (s/√n)

4단계: 기각역(임계값) 또는 p값 결정
   양측 Z검정: |Z| > 1.96 이면 기각
   또는 p값 < 0.05 이면 기각

5단계: 결론
   "유의수준 5%에서 귀무가설을 기각한다 (기각하지 못한다)"

6. 검정 종류별 적용 기준

6-1. Z 검정

조건: 모표준편차 σ를 알고 있거나, n ≥ 30 (CLT로 정규 근사)

Z = (x̄ - μ₀) / (σ/√n)  ~  N(0, 1)

유형	기각역 (α=0.05)
양측	\|Z\| > 1.960
우측 단측	Z > 1.645
좌측 단측	Z < -1.645

6-2. t 검정

조건: σ 모름, n < 30 (소표본)

t = (x̄ - μ₀) / (s/√n)  ~  t(n-1)

이표본 t검정 (두 그룹 평균 비교):

등분산 가정 시:
  t = (x̄₁ - x̄₂) / (Sp × √(1/n₁ + 1/n₂))
  Sp² = [(n₁-1)s₁² + (n₂-1)s₂²] / (n₁+n₂-2)  (합동분산)
  자유도 = n₁ + n₂ - 2

6-3. F 검정 (등분산 검정)

조건: 두 집단의 분산이 같은지 검정

F = s₁² / s₂²  ~  F(n₁-1, n₂-1)

ANOVA에서의 F 검정:

F = MSB / MSW = (급간 분산) / (급내 분산)
F > F(α, k-1, N-k) 이면 H₀ 기각 (집단 간 차이 있음)

6-4. χ² 검정

적합도 검정 — 관찰 빈도가 기대 빈도와 일치하는가?

χ² = Σ (O - E)² / E  ~  χ²(k-1)

O: 관찰 빈도, E: 기대 빈도, k: 범주 수

독립성 검정 — 두 범주형 변수가 독립인가?

χ² = Σ (O_ij - E_ij)² / E_ij
자유도 = (행수-1)(열수-1)

7. 검정력과 표본 크기

검정력(Power) = 1 - β: 실제로 H₁이 사실일 때 이를 올바르게 기각하는 확률

검정력에 영향을 주는 요소:
  ↑ n (표본 크기) → 검정력↑
  ↑ 효과 크기(δ = |μ₁-μ₀|) → 검정력↑
  ↑ α (유의수준) → 검정력↑ (하지만 α오류도↑)
  ↓ σ (분산) → 검정력↑

표본 크기 결정 공식 (단일 모평균 양측 검정):

n = (Z_α/2 + Z_β)² × σ² / δ²

δ: 탐지하고자 하는 최소 차이
Z_α/2: 유의수준에 대한 Z값 (α=0.05 → 1.96)
Z_β:   검정력에 대한 Z값 (Power=0.80 → 0.84)

예: σ=10, δ=5, α=0.05, Power=0.80일 때

n = (1.96 + 0.84)² × 100 / 25 = 7.84 × 4 = 31.4 → n = 32

8. 검정 유형 선택 가이드

비교 대상
  ├── 평균
  │     ├── 1개 집단 vs 기준값
  │     │     ├── σ 알고 있음 (or n≥30) → Z 검정
  │     │     └── σ 모름, n<30 → t 검정 (자유도 n-1)
  │     ├── 2개 집단 비교
  │     │     ├── 독립 → 이표본 t 검정
  │     │     └── 대응(전/후) → 대응 t 검정
  │     └── 3개 이상 집단 → ANOVA (F 검정)
  │
  ├── 분산
  │     ├── 1개 집단 → χ² 검정
  │     └── 2개 집단 → F 검정
  │
  └── 비율/빈도 (범주형)
        ├── 적합도 검정 → χ² 검정
        └── 독립성 검정 → χ² 검정

9. 계산 예시

문제: 기존 공정 평균 μ₀ = 100, 개선 후 n=25 표본에서 x̄ = 103, s = 8.
평균이 유의하게 변했는가? (α = 0.05, 양측)

H₀: μ = 100,  H₁: μ ≠ 100

t = (103 - 100) / (8/√25)
  = 3 / 1.6
  = 1.875

자유도 ν = 25 - 1 = 24
임계값 t(0.025, 24) = 2.064

|t| = 1.875 < 2.064  →  H₀ 채택

결론: 유의수준 5%에서 평균 변화를 통계적으로 확인할 수 없다.
     (개선이 없다는 것이 아니라, 증거가 충분하지 않은 것)