[통계] 단측 검정(One-tailed Test) 이론 & 예시

통계

[통계] 단측 검정(One-tailed Test) 이론 & 예시

Jin_Omics 2025. 2. 26. 10:55

1. 단측 검정이란?

단측 검정은 가설 검정에서 한 방향으로만 차이를 검증할 때 사용하는 방법.

오른쪽 단측 검정: 값이 기준보다 큰지 확인할 때
왼쪽 단측 검정: 값이 기준보다 작은지 확인할 때

단측검정 vs 양측검정 비교표

구분	양측 검정(Two-tailed Test)	단측 검정 (One-tailed Test)
유의수준 (α)	α = 0.05 → 양쪽으로 나눠 각 2.5%씩 분배	α = 0.05 → 한쪽에 5% 집중
기준 Z값	±1.96	1.645 또는 -1.645 (검정 방향에 따라 선택)
기각 기준	Z값이 ±1.96을 벗어나면 귀무가설 기각	Z값이 1.645 (또는 -1.645)를 넘으면 기각
신뢰구간	중앙 95%	한쪽으로 95%
사용 예시	"평균이 다를까?" → 차이가 있는지 확인	"평균이 더 클까/작을까?" → 특정 방향 확인
적합한 경우	차이가 "크거나 작다" 모두 중요할 때 사용	한쪽 방향의 차이만 중요할 때 사용

2. 기본 개념 정리

용어	설명
귀무가설 (H₀)	기본 가정. "변화 없음" 또는 "주장대로이다"
대립가설 (H₁)	귀무가설이 틀렸다고 주장하는 가설. 검증하고 싶은 내용
유의수준 (α)	제1종 오류 허용 한계. 보통 0.05 또는 0.01 사용
검정 통계량 (Z값)	표본과 귀무가설의 차이를 수치화한 값
기각역	Z값이 이 영역에 들어가면 귀무가설을 기각
p-value	"이 정도 결과가 우연히 나올 확률" → 작을수록 귀무가설 기각 가능성 ↑

3. 예시 문제: 피자 토핑 검정 🍕

문제:
피자집 사장님은 “우리 피자에는 평균적으로 10개의 토핑이 올라간다”고 주장했다. 🍕

→ “진짜 그럴까? ” 🤔

→ 피자를 30판 주문, 토핑을 세어보니 평균 9 표준편차 1.5 였다.

사장님의 주장을 신뢰할 수 있는지 가설 검정을 해보자!

💡 주어진 데이터:

표본 평균(\bar X) = 9
모평균(μ) = 10 (사장님 주장)
표본 표준편차(s) = 1.5
표본 크기(n) = 30
유의수준(α) = 0.05 (단측 검정)

✔️ STEP 1: 가설 세우기

귀무가설(H₀): μ = 10 → 사장님의 말이 맞다
대립가설(H₁): μ < 10 → 사장님의 말이 틀렸다 (토핑이 적다)

✔️ STEP 2: Z-값 계산하기

Z-검정 공식:

대입:

✔️ STEP 3: 기각 여부 판단

유의수준(α = 0.05) → 임계값(Critical Value) Z = -1.645
우리가 구한 Z = -3.65(🟢) : 임계값(🔴)보다 왼쪽에 있음 → 기각역에 해당!

4. 결과 해석 (그래프 참고):

🔴 빨간색 음영 → 기각역 (Z < -1.645)
🟢 초록색 점선 → 계산된 Z값 (Z = -3.65)

💡 결론:

기준선 Z = -1.645보다 왼쪽에 있는 결과(기각역에 위치) → 귀무가설 기각
계산된 Z = -3.65는 기각역 안(왼쪽)에 들어가기 때문에 → 귀무가설 기각! 🎉
사장님의 말은 통계적으로 틀렸다고 볼 수 있다! 🍕

5. p-value 해석

상황:
피자집 사장님은 "우리 피자엔 평균적으로 10개의 토핑이 올라간다!" 라고 말했다.

하지만 우리가 피자 30판을 사서 세어본 결과, 평균 9개의 토핑이 나왔다.

검정을 해봤더니, p-value ≈ 0.00013 이라는 결과가 나왔다.

p-value ≈ 0.00013 → 매우 작음
p < 0.05 → 귀무가설 기각 가능

Q1. p-value가 뭘 의미할까?

귀무 가설이 맞다고 가정했을 때, 관측된 결과가 나올 확률(어떤 사건이 우연히 발생할 확률)

🍕 피자 예시:

피자집 주장: 평균 토핑 10개
우리가 관측한 결과: 평균 토핑 9개
p-value = 0.00013 → 주장이 맞다면 이런 결과가 나올 확률은 0.013%

🚫 틀린 해석:

"사장님 말이 틀릴 확률이 99.987%다" ❌
"앞으로 피자를 시키면 토핑이 적게 나올 확률이 99%다" ❌

🙆‍♀️올바른 해석:

"사장님 말이 맞다고 가정했을 때, 이렇게 토핑이 적게 나올 확률은 0.013%밖에 안 돼!"
"이런 일이 실제로 벌어졌으니, 사장님 말을 믿이 어렵다고볼 수 있다."

Q2. 유의수준(α)을 0.05로 잡았다면, 사장님 말은 어떻게 될까?

유의수준: 귀무 가설이 맞는데 잘못 기각할 확률
α = 0.05 → "5% 이내로 드문 일이라면, 귀무가설을 기각할 수 있다!"
p-value = 0.00013 → 0.05보다 훨씬 작음 → 귀무가설 기각!

→ "우리가 허용한 최대 오차인 5%보다 p-value가 훨신 작으니까, 이 결과는 '우연'으로 보기 어려워. 이건 진짜 우연이라기 보단, 사장님 말이 틀렸다고 보는게 맞아🙅‍♂️. 귀무가설을 기각할 수 있어!"

Q3. 왜 p-value가 작을수록 귀무가설을 기각할 수 있을까?

p-value가 작을 수록 우연히 이런 결과가 나올 확률이 작기 때문: 주장이 틀리다고 보는 게 더 합리적

💡 해석:
"사장님 주장이 맞다면(μ = 10), 이 정도로 토핑이 적게 나올 확률은 0.013%밖에 안 되니까, (매우 드물게 일어나야 하는 일이 실제로 일어났으니) 사장님의 주장이 틀렸다고 보는 게 더 합리적이야! "

6. 요약

용어설명

귀무가설 (H₀)	μ = 10 : "피자 토핑 평균은 10개다"
대립가설 (H₁)	μ < 10 : "피자 토핑 평균은 10개 미만이다"
유의수준 (α)	"5% 확률 이내면 귀무가설 기각"
Z값	-3.65 → 기각역 안쪽에 위치
p-value	0.00013 → 매우 유의미한 결과
결론	귀무가설 기각 → 사장님 말 틀렸다! 🍕

저작자표시 비영리 변경금지 (새창열림)

'통계' 카테고리의 다른 글

통계와 나 (0)	2025.04.24
[통계] 제 1종 오류(α) vs 제 2종 오류(β) (0)	2025.02.27
통계적 가설 검정(Statistical Inferences) (1)	2025.02.25
[통계] 자유도(degree of freedom, d.f.) (2)	2025.02.17

현재글[통계] 단측 검정(One-tailed Test) 이론 & 예시

JINetic CODE

Jin_Omics의 연구자 성장기 + 대학원 이야기.

제1종오류, denovo변이, 인구집단층화, ukbiobank, 삼성융합의과학원, 성균관대학교대학원, 논문 종류, ukb, saihst, 디지털헬스학과, 교란변수, 드노보변이, 스코핑리뷰, randomised experiments, 제2종오류, gwas, spuriousassociation, 생식세포변이, denovovariants, R, sahist, causalinference, uk biobank, 시스템리뷰, 코랩plotly, 무작위실험, 인과추론, 대학원컨택, foundationmodel, randomised controlled trials,

Today :
Yesterday :

일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

JINetic CODE