가설검정 — 귀무가설·p값·검정력·Z·t·F·χ² 검정
통계적 가설검정의 논리 구조(귀무가설/대립가설, 유의수준, p값), 단측/양측 검정, 검정력과 표본 크기 결정, Z·t·F·χ² 검정의 적용 기준을 정리합니다.
가설검정이란?
표본 데이터를 근거로 모집단에 대한 주장(가설)이 옳은지 판단하는 통계적 절차입니다.
예: "A 공정 개선 후 불량률이 줄었다" → 데이터로 검증 가능한가?
"두 공급업체의 부품 강도에 차이가 있는가?"
검정은 항상 두 가설의 대결입니다.
1. 귀무가설과 대립가설
| 구분 | 기호 | 의미 | 특징 |
|---|---|---|---|
| 귀무가설 (Null Hypothesis) | H₀ | "차이 없음", "변화 없음" | 기본 전제, 검정으로 기각 시도 |
| 대립가설 (Alternative Hypothesis) | H₁ (또는 Hₐ) | "차이 있음", "개선됨" | 연구자가 증명하고 싶은 내용 |
가설 설정 원칙
"증명하고 싶은 것"을 대립가설(H₁) 로 설정합니다.
귀무가설은 그 반대(현상 유지)로 자동 결정됩니다.
예시:
| 연구 질문 | H₀ | H₁ |
|---|---|---|
| 개선 후 평균이 달라졌나? | μ = μ₀ | μ ≠ μ₀ (양측) |
| 불량률이 줄었나? | p ≥ p₀ | p < p₀ (단측) |
| 두 공장 분산이 같나? | σ₁² = σ₂² | σ₁² ≠ σ₂² (양측) |
2. 오류 유형과 유의수준
두 가지 판정 오류
| H₀ 사실 | H₁ 사실 | |
|---|---|---|
| H₀ 채택 | ✓ 올바른 판정 | β 오류 (2종 오류, 놓침) |
| H₀ 기각 | α 오류 (1종 오류, 오경보) | ✓ 올바른 판정 |
- α (유의수준): H₀이 사실인데 기각할 확률 — 연구자가 미리 설정 (보통 0.05)
- β: H₁이 사실인데 H₀을 채택할 확률 — 작을수록 좋음
- 검정력 (Power) = 1 - β: 실제 차이가 있을 때 올바르게 기각하는 능력
💡 샘플링 검사와 비교: α = 생산자위험, β = 소비자위험과 같은 구조입니다.
유의수준 선택 기준
| α | 사용 상황 |
|---|---|
| 0.10 | 탐색적 연구, 1차 스크리닝 |
| 0.05 | 일반 품질 연구 (가장 많이 사용) |
| 0.01 | 안전·의료·중요 공정 변경 |
3. p값 (p-value)
p값: 귀무가설이 사실이라고 가정했을 때, 현재 표본 결과(또는 더 극단적인 결과)가 나올 확률
p값 ≤ α → H₀ 기각 (통계적으로 유의함)
p값 > α → H₀ 채택 (증거 불충분)
직관적 해석:
- p = 0.03이고 α = 0.05: "H₀이 사실이라면 이런 데이터가 나올 확률 3% → 희박 → H₀ 기각"
- p = 0.15이고 α = 0.05: "이런 데이터가 나올 확률 15% → 충분히 가능 → H₀ 유지"
⚠️ 흔한 오해: p값은 "H₀이 맞을 확률"이 아닙니다. H₀이 사실임을 가정했을 때 데이터가 나올 확률입니다.
4. 단측 검정 vs 양측 검정
양측 검정 (Two-tailed): H₁: μ ≠ μ₀
기각역이 양쪽에 α/2씩 분포
→ "방향 무관, 차이만 있으면 된다"
단측 검정 (One-tailed): H₁: μ > μ₀ 또는 H₁: μ < μ₀
기각역이 한쪽에 α 전부 집중
→ "방향이 중요, 개선됐는지 확인"
| 상황 | 선택 | 이유 |
|---|---|---|
| 단순히 차이 확인 | 양측 | 방향 모름 |
| 개선 여부 확인 | 단측 | 방향 명확 |
| 규격 초과 여부 | 단측 | 방향 명확 |
💡 주의: 데이터를 보고 나서 단측을 선택하면 안 됩니다. 사전에 결정해야 합니다.
5. 검정 절차 (5단계)
1단계: 가설 설정
H₀: μ = 50, H₁: μ ≠ 50
2단계: 유의수준 설정
α = 0.05
3단계: 검정 통계량 계산
Z = (x̄ - μ₀) / (σ/√n) 또는 t = (x̄ - μ₀) / (s/√n)
4단계: 기각역(임계값) 또는 p값 결정
양측 Z검정: |Z| > 1.96 이면 기각
또는 p값 < 0.05 이면 기각
5단계: 결론
"유의수준 5%에서 귀무가설을 기각한다 (기각하지 못한다)"
6. 검정 종류별 적용 기준
6-1. Z 검정
조건: 모표준편차 σ를 알고 있거나, n ≥ 30 (CLT로 정규 근사)
Z = (x̄ - μ₀) / (σ/√n) ~ N(0, 1)
| 유형 | 기각역 (α=0.05) |
|---|---|
| 양측 | |Z| > 1.960 |
| 우측 단측 | Z > 1.645 |
| 좌측 단측 | Z < -1.645 |
6-2. t 검정
조건: σ 모름, n < 30 (소표본)
t = (x̄ - μ₀) / (s/√n) ~ t(n-1)
이표본 t검정 (두 그룹 평균 비교):
등분산 가정 시:
t = (x̄₁ - x̄₂) / (Sp × √(1/n₁ + 1/n₂))
Sp² = [(n₁-1)s₁² + (n₂-1)s₂²] / (n₁+n₂-2) (합동분산)
자유도 = n₁ + n₂ - 2
6-3. F 검정 (등분산 검정)
조건: 두 집단의 분산이 같은지 검정
F = s₁² / s₂² ~ F(n₁-1, n₂-1)
ANOVA에서의 F 검정:
F = MSB / MSW = (급간 분산) / (급내 분산)
F > F(α, k-1, N-k) 이면 H₀ 기각 (집단 간 차이 있음)
6-4. χ² 검정
적합도 검정 — 관찰 빈도가 기대 빈도와 일치하는가?
χ² = Σ (O - E)² / E ~ χ²(k-1)
O: 관찰 빈도, E: 기대 빈도, k: 범주 수
독립성 검정 — 두 범주형 변수가 독립인가?
χ² = Σ (O_ij - E_ij)² / E_ij
자유도 = (행수-1)(열수-1)
7. 검정력과 표본 크기
검정력(Power) = 1 - β: 실제로 H₁이 사실일 때 이를 올바르게 기각하는 확률
검정력에 영향을 주는 요소:
↑ n (표본 크기) → 검정력↑
↑ 효과 크기(δ = |μ₁-μ₀|) → 검정력↑
↑ α (유의수준) → 검정력↑ (하지만 α오류도↑)
↓ σ (분산) → 검정력↑
표본 크기 결정 공식 (단일 모평균 양측 검정):
n = (Z_α/2 + Z_β)² × σ² / δ²
δ: 탐지하고자 하는 최소 차이
Z_α/2: 유의수준에 대한 Z값 (α=0.05 → 1.96)
Z_β: 검정력에 대한 Z값 (Power=0.80 → 0.84)
예: σ=10, δ=5, α=0.05, Power=0.80일 때
n = (1.96 + 0.84)² × 100 / 25 = 7.84 × 4 = 31.4 → n = 32
8. 검정 유형 선택 가이드
비교 대상
├── 평균
│ ├── 1개 집단 vs 기준값
│ │ ├── σ 알고 있음 (or n≥30) → Z 검정
│ │ └── σ 모름, n<30 → t 검정 (자유도 n-1)
│ ├── 2개 집단 비교
│ │ ├── 독립 → 이표본 t 검정
│ │ └── 대응(전/후) → 대응 t 검정
│ └── 3개 이상 집단 → ANOVA (F 검정)
│
├── 분산
│ ├── 1개 집단 → χ² 검정
│ └── 2개 집단 → F 검정
│
└── 비율/빈도 (범주형)
├── 적합도 검정 → χ² 검정
└── 독립성 검정 → χ² 검정
9. 계산 예시
문제: 기존 공정 평균 μ₀ = 100, 개선 후 n=25 표본에서 x̄ = 103, s = 8.
평균이 유의하게 변했는가? (α = 0.05, 양측)
H₀: μ = 100, H₁: μ ≠ 100
t = (103 - 100) / (8/√25)
= 3 / 1.6
= 1.875
자유도 ν = 25 - 1 = 24
임계값 t(0.025, 24) = 2.064
|t| = 1.875 < 2.064 → H₀ 채택
결론: 유의수준 5%에서 평균 변화를 통계적으로 확인할 수 없다.
(개선이 없다는 것이 아니라, 증거가 충분하지 않은 것)
관련 학습
- 표본분포와 중심극한정리 — 검정 통계량의 이론적 기반
- 계량형 확률 분포 — t·F·χ² 분포 상세
- 고전 실험계획법 (DOE) — ANOVA: F검정의 실전 적용
- 상관·회귀분석 — 회귀계수 유의성 검정