계수형 확률 분포 — 이항·포아송·초기하 분포
불량 개수·결점 수 등 이산형 품질 데이터를 모델링하는 이항분포·포아송분포·초기하분포를 정리합니다. 계수형 관리도(p, np, c, u)와 샘플링 검사의 이론적 기초입니다.
이산형 확률 분포란?
확률 변수 X가 0, 1, 2, 3, … 처럼 셀 수 있는 정수값만 취할 때 이산형 확률 분포라고 합니다.
품질에서는 불량 개수, 결점 수, 고장 횟수 등이 여기에 해당합니다.
예: 100개 검사 중 불량 수 X = 0, 1, 2, 3, ...
1시간 동안 발생한 고장 수 X = 0, 1, 2, ...
1. 이항 분포 (Binomial Distribution)
조건
다음 베르누이 시행(Bernoulli Trial) 조건이 충족되어야 합니다:
- 각 시행의 결과가 합격/불합격 두 가지뿐
- 각 시행은 독립적
- 불량률(p)이 매 시행마다 일정
- 시행 횟수 n이 고정
확률 질량 함수
P(X = k) = C(n, k) × p^k × (1-p)^(n-k)
n: 시행 횟수 (표본 크기)
p: 불량률 (한 번 시행에서 불량이 나올 확률)
k: 불량 개수 (0, 1, 2, ..., n)
C(n,k) = n! / (k!(n-k)!) : 이항계수
기댓값과 분산
E(X) = μ = np
Var(X) = σ² = np(1-p)
σ = √(np(1-p))
관리도 연결 (p, np 관리도)
| 관리도 | 기반 분포 | 사용 조건 |
|---|---|---|
| p 관리도 | 이항분포 | 표본 크기 n이 변할 때 불량률 관리 |
| np 관리도 | 이항분포 | 표본 크기 n이 일정할 때 불량 개수 관리 |
np 관리도 관리한계:
CL = np̄
UCL = np̄ + 3√(np̄(1 - p̄))
LCL = np̄ - 3√(np̄(1 - p̄)) [음수면 0으로 처리]
계산 예시
n = 50개 검사, p = 0.04 (불량률 4%)
불량 0개가 나올 확률은?
P(X = 0) = C(50, 0) × 0.04^0 × 0.96^50
= 1 × 1 × 0.96^50
= 0.96^50 ≈ 0.1299 = 약 13.0%
💡 시험 포인트: np 관리도의 UCL 공식과 기댓값 np는 자주 계산 문제로 출제됩니다.
2. 포아송 분포 (Poisson Distribution)
조건
단위 시간/면적/길이에서 발생하는 사건 수를 모델링합니다:
- 사건이 단위 구간에서 일정한 평균 비율(λ) 로 발생
- 각 사건은 독립적
- 두 사건이 동시에 발생하지 않음
확률 질량 함수
P(X = k) = (e^(-λ) × λ^k) / k!
λ: 단위 구간당 평균 발생 수 (모수)
k: 실제 발생 수 (0, 1, 2, ...)
e ≈ 2.71828
기댓값과 분산
E(X) = Var(X) = λ ← 평균과 분산이 같다! (포아송의 특징)
σ = √λ
관리도 연결 (c, u 관리도)
| 관리도 | 기반 분포 | 사용 조건 |
|---|---|---|
| c 관리도 | 포아송분포 | 검사 단위(면적·길이) 일정 시 결점 수 관리 |
| u 관리도 | 포아송분포 | 검사 단위가 변할 때 단위당 결점 수 관리 |
c 관리도 관리한계:
CL = c̄
UCL = c̄ + 3√c̄
LCL = c̄ - 3√c̄ [음수면 0으로 처리]
이항분포 → 포아송 근사
n이 충분히 크고(n > 50), p가 작을 때(p < 0.1), 이항분포를 포아송으로 근사합니다:
B(n, p) ≈ Poisson(λ = np)
예: n = 200, p = 0.02 → λ = np = 4로 포아송 근사 사용
💡 시험 포인트: 이항 → 포아송 근사 조건(n 크고 p 작음), c 관리도의 UCL = c̄ + 3√c̄ 공식.
3. 초기하 분포 (Hypergeometric Distribution)
이항분포와의 차이
이항분포는 복원 추출 (p 일정)을 가정하지만,
초기하분포는 비복원 추출 (추출할 때마다 p가 변함)을 다룹니다.
예: 상자 안에 50개 (불량 5개, 양호 45개)
10개를 비복원 추출할 때 불량 k개가 나올 확률
확률 질량 함수
P(X = k) = [C(D, k) × C(N-D, n-k)] / C(N, n)
N: 모집단 크기
D: 모집단 내 불량 수
n: 표본 크기
k: 표본 내 불량 수
기댓값과 분산
E(X) = n × (D/N) = n × p
Var(X) = n × p × (1-p) × [(N-n)/(N-1)]
유한 모집단 수정계수: (N-n)/(N-1) ← 이항분포 분산과의 차이점
이항분포 근사 조건
n/N < 0.05 (표본 비율이 5% 미만)이면 이항분포로 근사합니다.
N이 충분히 크면: P(X=k) ≈ C(n,k) × p^k × (1-p)^(n-k)
샘플링 검사에서의 활용
KS Q ISO 2859 계수형 샘플링에서 OC 곡선 계산 시 이론적으로 초기하분포가 사용됩니다.
4. 세 분포 비교 요약
| 항목 | 이항분포 | 포아송분포 | 초기하분포 |
|---|---|---|---|
| 데이터 유형 | 불량 개수 | 결점 수, 고장 수 | 불량 개수 |
| 모수 | n, p | λ | N, D, n |
| 추출 방법 | 복원 (p 일정) | 단위 구간 | 비복원 |
| 평균 | np | λ | nD/N |
| 분산 | np(1-p) | λ | np(1-p)×(N-n)/(N-1) |
| 관리도 | p, np | c, u | — |
| 근사 관계 | n 크고 p 작으면 → 포아송 | — | n/N < 0.05 → 이항 |
5. 분포 선택 가이드
데이터가 이산형(개수)?
├── YES
│ ├── 비복원 추출 & n/N ≥ 0.05 → 초기하분포
│ ├── 합격/불합격 + 복원(p 일정) → 이항분포
│ │ └── n > 50, p < 0.1 → 포아송 근사 가능
│ └── 단위당 결점 수 / 사건 발생 수 → 포아송분포
└── NO (연속형) → 정규·t·F·χ²·지수·와이블 분포
6. 계산 예시 모음
이항분포
n = 20, p = 0.1, P(X = 2) = ?
P(X=2) = C(20,2) × 0.1² × 0.9^18
= 190 × 0.01 × 0.1501
= 0.2852 = 28.5%
포아송분포
시간당 평균 결점 수 λ = 3, P(X = 0) = ?
P(X=0) = e^(-3) × 3^0 / 0!
= e^(-3) × 1 / 1
= 0.0498 = 4.98%
초기하분포
N = 20, D = 4 (불량), n = 5 추출, P(X = 1) = ?
P(X=1) = C(4,1) × C(16,4) / C(20,5)
= 4 × 1820 / 15504
= 7280 / 15504
≈ 0.4696 = 46.96%
관련 학습
- 계량형 확률 분포 — 정규·t·F·χ²·지수·와이블
- 관리도 완전 가이드 — p, np, c, u 관리도 실전 적용
- 샘플링 검사 — OC 곡선과 분포의 연결