본문 바로가기
Chapter 9

베이즈 통계학 입문: 경험이 지식이 되는 과정

#베이즈 정리#사전 확률(Prior)#가능도(Likelihood)#사후 확률(Posterior)

베이즈 통계학: 확률을 업데이트하다

전통적인 통계학(빈도주의)이 “동전을 1,000번 던졌을 때 앞면이 나올 횟수”를 중시한다면, 베이즈 통계학은 **“내 믿음이 얼마나 정확한가?”**에 집중합니다. 우리는 새로운 정보가 들어올 때마다 기존의 지식을 끊임없이 수정하며 진실에 다가갑니다.

1. 베이즈 정리의 공식과 의미

P(AB)=P(BA)P(A)P(B)P(A|B) = \frac{P(B|A)P(A)}{P(B)}

  • P(A)P(A) (사전 확률): 새로운 데이터를 보기 전의 나의 믿음
  • P(BA)P(B|A) (가능도): 내 가설이 맞다면, 이 데이터가 나타날 확률
  • P(AB)P(A|B) (사후 확률): 데이터를 확인한 후 업데이트된 나의 믿음

2. 지식의 업데이트 프로세스

베이즈 주의자가 현실 세계에서 판단을 내리는 과정은 다음과 같습니다.

1
주관적 사전 믿음 설정

과거 경험이나 직관을 바탕으로 초기 확률을 부여합니다.

2
새로운 데이터 관측

현장에서 발생하는 실제 데이터(근거)를 수집합니다.

3
베이즈 갱신 실행

공식을 통해 사전 확률을 사후 확률로 변환합니다.

4
반복 적용

오늘의 사후 확률은 내일의 새로운 사전 확률이 되어 순환합니다.

3. 빈도주의 vs 베이즈주의의 결정적 차이

두 통계학적 관점의 비교

구분빈도주의 (Frequentist)베이즈주의 (Bayesian)
확률의 정의무한 반복 시 발생하는 빈도개인적인 믿음의 정도 (불확실성)
모수(Parameter)고정되어 있지만 알 수 없는 값확률 분포를 가진 변수
데이터의 역할유일한 판단 근거기존 믿음을 업데이트하는 수단
장점객관적이고 표준화된 절차적은 데이터로도 분석 시작 가능, 유연함

4. 실전 사례: 가상 암 진단 테스트의 업데이트

사전 확률이 1%인 희귀병 진단 키트의 결과를 베이지안 관점에서 업데이트한 예시입니다.

암 진단 결과에 따른 사후 확률 변화

양성 반응이 한 번 나왔을 때보다, 두 번 반복해서 양성이 나올 때 확신(확률)이 급격히 커집니다.


💡 교수님의 팁

스팸 메일 필터나 자율주행 자동차의 판단 알고리즘은 모두 이 베이즈 정리를 기반으로 합니다. “지금 센서에 잡힌 물체가 사람일 확률을 계속해서 업데이트하라”는 명령이죠. 우리 뇌가 학습하는 방식과 가장 닮아있는 통계학이기도 합니다.

🔗 다음 단계