계수형 확률 분포 — 이항·포아송·초기하 분포 | 학습 위키

이산형 확률 분포란?

확률 변수 X가 0, 1, 2, 3, … 처럼 셀 수 있는 정수값만 취할 때 이산형 확률 분포라고 합니다.
품질에서는 불량 개수, 결점 수, 고장 횟수 등이 여기에 해당합니다.

예: 100개 검사 중 불량 수 X = 0, 1, 2, 3, ...
   1시간 동안 발생한 고장 수 X = 0, 1, 2, ...

1. 이항 분포 (Binomial Distribution)

조건

다음 베르누이 시행(Bernoulli Trial) 조건이 충족되어야 합니다:

각 시행의 결과가 합격/불합격 두 가지뿐
각 시행은 독립적
불량률(p)이 매 시행마다 일정
시행 횟수 n이 고정

확률 질량 함수

P(X = k) = C(n, k) × p^k × (1-p)^(n-k)

n: 시행 횟수 (표본 크기)
p: 불량률 (한 번 시행에서 불량이 나올 확률)
k: 불량 개수 (0, 1, 2, ..., n)
C(n,k) = n! / (k!(n-k)!) : 이항계수

기댓값과 분산

E(X) = μ = np
Var(X) = σ² = np(1-p)
σ = √(np(1-p))

관리도 연결 (p, np 관리도)

관리도	기반 분포	사용 조건
p 관리도	이항분포	표본 크기 n이 변할 때 불량률 관리
np 관리도	이항분포	표본 크기 n이 일정할 때 불량 개수 관리

np 관리도 관리한계:
  CL  = np̄
  UCL = np̄ + 3√(np̄(1 - p̄))
  LCL = np̄ - 3√(np̄(1 - p̄))  [음수면 0으로 처리]

계산 예시

n = 50개 검사, p = 0.04 (불량률 4%)
불량 0개가 나올 확률은?

P(X = 0) = C(50, 0) × 0.04^0 × 0.96^50
         = 1 × 1 × 0.96^50
         = 0.96^50 ≈ 0.1299 = 약 13.0%

💡 시험 포인트: np 관리도의 UCL 공식과 기댓값 np는 자주 계산 문제로 출제됩니다.

2. 포아송 분포 (Poisson Distribution)

조건

단위 시간/면적/길이에서 발생하는 사건 수를 모델링합니다:

사건이 단위 구간에서 일정한 평균 비율(λ) 로 발생
각 사건은 독립적
두 사건이 동시에 발생하지 않음

확률 질량 함수

P(X = k) = (e^(-λ) × λ^k) / k!

λ: 단위 구간당 평균 발생 수 (모수)
k: 실제 발생 수 (0, 1, 2, ...)
e ≈ 2.71828

기댓값과 분산

E(X) = Var(X) = λ  ← 평균과 분산이 같다! (포아송의 특징)
σ = √λ

관리도 연결 (c, u 관리도)

관리도	기반 분포	사용 조건
c 관리도	포아송분포	검사 단위(면적·길이) 일정 시 결점 수 관리
u 관리도	포아송분포	검사 단위가 변할 때 단위당 결점 수 관리

c 관리도 관리한계:
  CL  = c̄
  UCL = c̄ + 3√c̄
  LCL = c̄ - 3√c̄  [음수면 0으로 처리]

이항분포 → 포아송 근사

n이 충분히 크고(n > 50), p가 작을 때(p < 0.1), 이항분포를 포아송으로 근사합니다:

B(n, p) ≈ Poisson(λ = np)

예: n = 200, p = 0.02 → λ = np = 4로 포아송 근사 사용

💡 시험 포인트: 이항 → 포아송 근사 조건(n 크고 p 작음), c 관리도의 UCL = c̄ + 3√c̄ 공식.

3. 초기하 분포 (Hypergeometric Distribution)

이항분포와의 차이

이항분포는 복원 추출 (p 일정)을 가정하지만,
초기하분포는 비복원 추출 (추출할 때마다 p가 변함)을 다룹니다.

예: 상자 안에 50개 (불량 5개, 양호 45개)
   10개를 비복원 추출할 때 불량 k개가 나올 확률

확률 질량 함수

P(X = k) = [C(D, k) × C(N-D, n-k)] / C(N, n)

N: 모집단 크기
D: 모집단 내 불량 수
n: 표본 크기
k: 표본 내 불량 수

기댓값과 분산

E(X) = n × (D/N)  =  n × p
Var(X) = n × p × (1-p) × [(N-n)/(N-1)]

유한 모집단 수정계수: (N-n)/(N-1)  ← 이항분포 분산과의 차이점

이항분포 근사 조건

n/N < 0.05 (표본 비율이 5% 미만)이면 이항분포로 근사합니다.

N이 충분히 크면: P(X=k) ≈ C(n,k) × p^k × (1-p)^(n-k)

샘플링 검사에서의 활용

KS Q ISO 2859 계수형 샘플링에서 OC 곡선 계산 시 이론적으로 초기하분포가 사용됩니다.

4. 세 분포 비교 요약

항목	이항분포	포아송분포	초기하분포
데이터 유형	불량 개수	결점 수, 고장 수	불량 개수
모수	n, p	λ	N, D, n
추출 방법	복원 (p 일정)	단위 구간	비복원
평균	np	λ	nD/N
분산	np(1-p)	λ	np(1-p)×(N-n)/(N-1)
관리도	p, np	c, u	—
근사 관계	n 크고 p 작으면 → 포아송	—	n/N < 0.05 → 이항

5. 분포 선택 가이드

데이터가 이산형(개수)?
  ├── YES
  │    ├── 비복원 추출 & n/N ≥ 0.05 → 초기하분포
  │    ├── 합격/불합격 + 복원(p 일정) → 이항분포
  │    │     └── n > 50, p < 0.1 → 포아송 근사 가능
  │    └── 단위당 결점 수 / 사건 발생 수 → 포아송분포
  └── NO (연속형) → 정규·t·F·χ²·지수·와이블 분포

6. 계산 예시 모음

이항분포

n = 20, p = 0.1, P(X = 2) = ?

P(X=2) = C(20,2) × 0.1² × 0.9^18
        = 190 × 0.01 × 0.1501
        = 0.2852 = 28.5%

포아송분포

시간당 평균 결점 수 λ = 3, P(X = 0) = ?

P(X=0) = e^(-3) × 3^0 / 0!
        = e^(-3) × 1 / 1
        = 0.0498 = 4.98%

초기하분포

N = 20, D = 4 (불량), n = 5 추출, P(X = 1) = ?

P(X=1) = C(4,1) × C(16,4) / C(20,5)
        = 4 × 1820 / 15504
        = 7280 / 15504
        ≈ 0.4696 = 46.96%

계수형 확률 분포 — 이항·포아송·초기하 분포

이산형 확률 분포란?

1. 이항 분포 (Binomial Distribution)

조건

확률 질량 함수

기댓값과 분산

관리도 연결 (p, np 관리도)

계산 예시

2. 포아송 분포 (Poisson Distribution)

조건

확률 질량 함수

기댓값과 분산

관리도 연결 (c, u 관리도)

이항분포 → 포아송 근사

3. 초기하 분포 (Hypergeometric Distribution)

이항분포와의 차이

확률 질량 함수

기댓값과 분산

이항분포 근사 조건

샘플링 검사에서의 활용

4. 세 분포 비교 요약

5. 분포 선택 가이드

6. 계산 예시 모음

이항분포

포아송분포

초기하분포

관련 학습