통계

[통계] 단측 검정(One-tailed Test) 이론 & 예시

Jin_Omics 2025. 2. 26. 10:55

1. 단측 검정이란?

단측 검정은 가설 검정에서 한 방향으로만 차이를 검증할 때 사용하는 방법.

  • 오른쪽 단측 검정: 값이 기준보다 큰지 확인할 때
  • 왼쪽 단측 검정: 값이 기준보다 작은지 확인할 때

 

단측검정 vs 양측검정 비교표

구분 양측 검정(Two-tailed Test) 단측 검정 (One-tailed Test)
유의수준 (α) α = 0.05 → 양쪽으로 나눠 각 2.5%씩 분배 α = 0.05 → 한쪽에 5% 집중
기준 Z값 ±1.96 1.645 또는 -1.645 (검정 방향에 따라 선택)
기각 기준 Z값이 ±1.96을 벗어나면 귀무가설 기각 Z값이 1.645 (또는 -1.645)를 넘으면 기각
신뢰구간 중앙 95% 한쪽으로 95%
사용 예시 "평균이 다를까?" → 차이가 있는지 확인 "평균이 더 클까/작을까?" → 특정 방향 확인
적합한 경우 차이가 "크거나 작다" 모두 중요할 때 사용 한쪽 방향의 차이만 중요할 때 사용

2. 기본 개념 정리

용어 설명
귀무가설 (H₀) 기본 가정. "변화 없음" 또는 "주장대로이다"
대립가설 (H₁) 귀무가설이 틀렸다고 주장하는 가설. 검증하고 싶은 내용
유의수준 (α) 제1종 오류 허용 한계. 보통 0.05 또는 0.01 사용
검정 통계량 (Z값) 표본과 귀무가설의 차이를 수치화한 값
기각역 Z값이 이 영역에 들어가면 귀무가설을 기각
p-value "이 정도 결과가 우연히 나올 확률" → 작을수록 귀무가설 기각 가능성 ↑

3. 예시 문제: 피자 토핑 검정 🍕

 

문제:
피자집 사장님은 “우리 피자에는 평균적으로 10개의 토핑이 올라간다”고 주장했다. 🍕

“진짜 그럴까? ” 🤔

→ 피자를 30판 주문, 토핑을 세어보니 평균 9 표준편차 1.5 였다.

사장님의 주장을 신뢰할 수 있는지 가설 검정을 해보자!

 

💡 주어진 데이터:

  • 표본 평균(\bar X) = 9
  • 모평균(μ) = 10 (사장님 주장)
  • 표본 표준편차(s) = 1.5
  • 표본 크기(n) = 30
  • 유의수준(α) = 0.05 (단측 검정)

✔️  STEP 1: 가설 세우기

  • 귀무가설(H₀): μ = 10 → 사장님의 말이 맞다
  • 대립가설(H₁): μ < 10 → 사장님의 말이 틀렸다 (토핑이 적다)

✔️  STEP 2: Z-값 계산하기

Z-검정 공식:

 

대입:

 


✔️  STEP 3: 기각 여부 판단

  • 유의수준(α = 0.05)임계값(Critical Value) Z = -1.645
  • 우리가 구한 Z = -3.65(🟢) : 임계값(🔴)보다 왼쪽에 있음  기각역에 해당!

4. 결과 해석 (그래프 참고):

  • 🔴 빨간색 음영  기각역 (Z < -1.645)
  • 🟢 초록색 점선 → 계산된 Z값 (Z = -3.65)

 
💡 결론:

  • 기준선 Z = -1.645보다 왼쪽에 있는 결과(기각역에 위치) → 귀무가설 기각
  • 계산된 Z = -3.65기각역 안(왼쪽)에 들어가기 때문에 → 귀무가설 기각! 🎉
  • 사장님의 말은 통계적으로 틀렸다고 볼 수 있다! 🍕

5. p-value 해석

상황:
피자집 사장님은 "우리 피자엔 평균적으로 10개의 토핑이 올라간다!" 라고 말했다. 

하지만 우리가 피자 30판을 사서 세어본 결과, 평균 9개의 토핑이 나왔다.


검정을 해봤더니, p-value ≈ 0.00013 이라는 결과가 나왔다.

 

  • p-value ≈ 0.00013 → 매우 작음
  • p < 0.05 → 귀무가설 기각 가능

 

Q1. p-value가 뭘 의미할까?

  • 귀무 가설이 맞다고 가정했을 때, 관측된 결과가 나올 확률(어떤 사건이 우연히 발생할 확률)

🍕 피자 예시:

  • 피자집 주장: 평균 토핑 10개
  • 우리가 관측한 결과: 평균 토핑 9개 
  • p-value = 0.00013 → 주장이 맞다면 이런 결과가 나올 확률은 0.013%

🚫 틀린 해석:

  • "사장님 말이 틀릴 확률이 99.987%다" ❌
  • "앞으로 피자를 시키면 토핑이 적게 나올 확률이 99%다" ❌

🙆‍♀️올바른 해석:

  • "사장님 말이 맞다고 가정했을 때, 이렇게 토핑이 적게 나올 확률은 0.013%밖에 안 돼!"
  • "이런 일이 실제로 벌어졌으니, 사장님 말을 믿이 어렵다고볼 수 있다."

 

Q2. 유의수준(α)을 0.05로 잡았다면, 사장님 말은 어떻게 될까?

  • 유의수준: 귀무 가설이 맞는데 잘못 기각할 확률
  • α = 0.05 → "5% 이내로 드문 일이라면, 귀무가설을 기각할 수 있다!"
  • p-value = 0.00013 → 0.05보다 훨씬 작음 → 귀무가설 기각!

    → "우리가 허용한 최대 오차인 5%보다 p-value가 훨신 작으니까, 이 결과는 '우연'으로 보기 어려워. 이건 진짜 우연이라기 보단, 사장님 말이 틀렸다고 보는게 맞아🙅‍♂️. 귀무가설을 기각할 수 있어!"

 

Q3. 왜 p-value가 작을수록 귀무가설을 기각할 수 있을까?

  • p-value가 작을 수록 우연히 이런 결과가 나올 확률이 작기 때문: 주장이 틀리다고 보는 게 더 합리적

 

💡 해석:
"사장님 주장이 맞다면(μ = 10), 이 정도로 토핑이 적게 나올 확률은 0.013%밖에 안 되니까, (매우 드물게 일어나야 하는 일이 실제로 일어났으니) 사장님의 주장이 틀렸다고 보는 게 더 합리적이야! "


6. 요약

용어설명

귀무가설 (H₀) μ = 10 : "피자 토핑 평균은 10개다"
대립가설 (H₁) μ < 10 : "피자 토핑 평균은 10개 미만이다"
유의수준 (α) "5% 확률 이내면 귀무가설 기각"
Z값 -3.65 → 기각역 안쪽에 위치
p-value 0.00013 → 매우 유의미한 결과
결론 귀무가설 기각 → 사장님 말 틀렸다! 🍕