본문 바로가기
Chapter 3

가설 검정: 데이터로 진실을 판별하다

#귀무가설(H0)#대립가설(H1)#유의수준#P-value

가설 검정: ‘진짜’인가 ‘우연’인가?

새로운 치료제가 효과가 있다는 결과를 얻었다면, 그것은 정말 약 덕분일까요, 아니면 운 좋게 건강한 사람들만 실험에 참여했기 때문일까요? 통계학은 이 질문에 대한 논리적인 대답을 제시합니다.

1. 가설 세우기: 무죄 추정의 원칙

가설 검정은 법정의 재판 과정과 매우 유사합니다.

  • 귀무가설 (H0H_0): “차이가 없다”, “효과가 없다”라고 가정하는 가설입니다. (피고인의 무죄 추정)
  • 대립가설 (H1H_1): 우리가 증명하고 싶은 “차이가 있다”, “효과가 있다”라는 가설입니다. (유죄 입증)

우리는 충분한 증거(데이터)가 있을 때만 귀무가설을 기각하고 대립가설을 채택합니다.

2. 가설 검정의 5단계 프로세스

통계적 결론에 도달하기 위해 우리는 다음과 같은 엄격한 단계를 거칩니다.

1
가설 설정

귀무가설과 대립가설을 명확히 정의합니다.

2
유의수준 결정

얼마나 엄격하게 판단할지 기준(α=0.05 등)을 정합니다.

3
검정통계량 계산

데이터를 통해 얻은 차이를 표준화된 점수로 바꿉니다.

4
P-value 확인

귀무가설이 맞을 때, 이런 결과가 나올 확률을 구합니다.

5
결론 도출

P-value가 유의수준보다 작으면 귀무가설을 기각합니다.

3. P-value의 흔한 오해

P-value가 0.01이라면 “대립가설이 맞을 확률이 99%“라는 뜻일까요? 아닙니다.

P-value는 “귀무가설이 사실이라는 가정하에, 현재 데이터와 같은(혹은 더 극단적인) 결과가 나올 확률”입니다. 즉, P-value가 낮다는 것은 “이 결과가 우연히 일어났다고 보기엔 너무나 희박하다”는 것을 의미합니다.


💡 교수님의 팁

‘통계적으로 유의미하다’는 말이 반드시 ‘현실적으로 중요하다’는 뜻은 아닙니다. 아주 많은 데이터를 모으면 아주 미세한 차이도 P-value를 낮출 수 있기 때문입니다. 수치 너머의 맥락을 읽는 눈이 필요한 이유입니다.

🔗 다음 단계