학습 위키로 돌아가기
📉 기초 통계품질기술사 출제 영역

계수형 확률 분포 — 이항·포아송·초기하 분포

불량 개수·결점 수 등 이산형 품질 데이터를 모델링하는 이항분포·포아송분포·초기하분포를 정리합니다. 계수형 관리도(p, np, c, u)와 샘플링 검사의 이론적 기초입니다.

최종 수정: 2026년 5월 23일
확률분포이항분포포아송분포초기하분포계수형관리도품질기술사

이산형 확률 분포란?

확률 변수 X가 0, 1, 2, 3, … 처럼 셀 수 있는 정수값만 취할 때 이산형 확률 분포라고 합니다.
품질에서는 불량 개수, 결점 수, 고장 횟수 등이 여기에 해당합니다.

예: 100개 검사 중 불량 수 X = 0, 1, 2, 3, ...
   1시간 동안 발생한 고장 수 X = 0, 1, 2, ...

1. 이항 분포 (Binomial Distribution)

조건

다음 베르누이 시행(Bernoulli Trial) 조건이 충족되어야 합니다:

  1. 각 시행의 결과가 합격/불합격 두 가지뿐
  2. 각 시행은 독립적
  3. 불량률(p)이 매 시행마다 일정
  4. 시행 횟수 n이 고정

확률 질량 함수

P(X = k) = C(n, k) × p^k × (1-p)^(n-k)

n: 시행 횟수 (표본 크기)
p: 불량률 (한 번 시행에서 불량이 나올 확률)
k: 불량 개수 (0, 1, 2, ..., n)
C(n,k) = n! / (k!(n-k)!) : 이항계수

기댓값과 분산

E(X) = μ = np
Var(X) = σ² = np(1-p)
σ = √(np(1-p))

관리도 연결 (p, np 관리도)

관리도기반 분포사용 조건
p 관리도이항분포표본 크기 n이 변할 때 불량률 관리
np 관리도이항분포표본 크기 n이 일정할 때 불량 개수 관리
np 관리도 관리한계:
  CL  = np̄
  UCL = np̄ + 3√(np̄(1 - p̄))
  LCL = np̄ - 3√(np̄(1 - p̄))  [음수면 0으로 처리]

계산 예시

n = 50개 검사, p = 0.04 (불량률 4%)
불량 0개가 나올 확률은?

P(X = 0) = C(50, 0) × 0.04^0 × 0.96^50
         = 1 × 1 × 0.96^50
         = 0.96^50 ≈ 0.1299 = 약 13.0%

💡 시험 포인트: np 관리도의 UCL 공식과 기댓값 np는 자주 계산 문제로 출제됩니다.


2. 포아송 분포 (Poisson Distribution)

조건

단위 시간/면적/길이에서 발생하는 사건 수를 모델링합니다:

  1. 사건이 단위 구간에서 일정한 평균 비율(λ) 로 발생
  2. 각 사건은 독립적
  3. 두 사건이 동시에 발생하지 않음

확률 질량 함수

P(X = k) = (e^(-λ) × λ^k) / k!

λ: 단위 구간당 평균 발생 수 (모수)
k: 실제 발생 수 (0, 1, 2, ...)
e ≈ 2.71828

기댓값과 분산

E(X) = Var(X) = λ  ← 평균과 분산이 같다! (포아송의 특징)
σ = √λ

관리도 연결 (c, u 관리도)

관리도기반 분포사용 조건
c 관리도포아송분포검사 단위(면적·길이) 일정 시 결점 수 관리
u 관리도포아송분포검사 단위가 변할 때 단위당 결점 수 관리
c 관리도 관리한계:
  CL  = c̄
  UCL = c̄ + 3√c̄
  LCL = c̄ - 3√c̄  [음수면 0으로 처리]

이항분포 → 포아송 근사

n이 충분히 크고(n > 50), p가 작을 때(p < 0.1), 이항분포를 포아송으로 근사합니다:

B(n, p) ≈ Poisson(λ = np)

예: n = 200, p = 0.02 → λ = np = 4로 포아송 근사 사용

💡 시험 포인트: 이항 → 포아송 근사 조건(n 크고 p 작음), c 관리도의 UCL = c̄ + 3√c̄ 공식.


3. 초기하 분포 (Hypergeometric Distribution)

이항분포와의 차이

이항분포는 복원 추출 (p 일정)을 가정하지만,
초기하분포는 비복원 추출 (추출할 때마다 p가 변함)을 다룹니다.

예: 상자 안에 50개 (불량 5개, 양호 45개)
   10개를 비복원 추출할 때 불량 k개가 나올 확률

확률 질량 함수

P(X = k) = [C(D, k) × C(N-D, n-k)] / C(N, n)

N: 모집단 크기
D: 모집단 내 불량 수
n: 표본 크기
k: 표본 내 불량 수

기댓값과 분산

E(X) = n × (D/N)  =  n × p
Var(X) = n × p × (1-p) × [(N-n)/(N-1)]

유한 모집단 수정계수: (N-n)/(N-1)  ← 이항분포 분산과의 차이점

이항분포 근사 조건

n/N < 0.05 (표본 비율이 5% 미만)이면 이항분포로 근사합니다.

N이 충분히 크면: P(X=k) ≈ C(n,k) × p^k × (1-p)^(n-k)

샘플링 검사에서의 활용

KS Q ISO 2859 계수형 샘플링에서 OC 곡선 계산 시 이론적으로 초기하분포가 사용됩니다.


4. 세 분포 비교 요약

항목이항분포포아송분포초기하분포
데이터 유형불량 개수결점 수, 고장 수불량 개수
모수n, pλN, D, n
추출 방법복원 (p 일정)단위 구간비복원
평균npλnD/N
분산np(1-p)λnp(1-p)×(N-n)/(N-1)
관리도p, npc, u
근사 관계n 크고 p 작으면 → 포아송n/N < 0.05 → 이항

5. 분포 선택 가이드

데이터가 이산형(개수)?
  ├── YES
  │    ├── 비복원 추출 & n/N ≥ 0.05 → 초기하분포
  │    ├── 합격/불합격 + 복원(p 일정) → 이항분포
  │    │     └── n > 50, p < 0.1 → 포아송 근사 가능
  │    └── 단위당 결점 수 / 사건 발생 수 → 포아송분포
  └── NO (연속형) → 정규·t·F·χ²·지수·와이블 분포

6. 계산 예시 모음

이항분포

n = 20, p = 0.1, P(X = 2) = ?

P(X=2) = C(20,2) × 0.1² × 0.9^18
        = 190 × 0.01 × 0.1501
        = 0.2852 = 28.5%

포아송분포

시간당 평균 결점 수 λ = 3, P(X = 0) = ?

P(X=0) = e^(-3) × 3^0 / 0!
        = e^(-3) × 1 / 1
        = 0.0498 = 4.98%

초기하분포

N = 20, D = 4 (불량), n = 5 추출, P(X = 1) = ?

P(X=1) = C(4,1) × C(16,4) / C(20,5)
        = 4 × 1820 / 15504
        = 7280 / 15504
        ≈ 0.4696 = 46.96%

관련 학습