통계

통계적 가설 검정(Statistical Inferences)

Jin_Omics 2025. 2. 25. 23:43

1. 통계적 추론:

"모든 데이터를 볼 수 없으니까, 일부만 보고 전체를 추측하자!"

 

통계적 추론에는 3가지 방법:

방법 설명 예시
점 추정 정확한 수치 추정 평균이 딱 50일 거야
구간 추정 범위를 추정 평균이 48~52 사이일 거야
가설 검정 가설을 세우고 검증 정말 평균이 50일까?

 

이 중, 가설 검정에 대해 알아보자!


2. 가설검정(Hypothesis Testing):

샘플 데이터를 이용해, 모집단에 대한 가설이 맞는지 틀린지를 통계적으로 검증하는 과정!

 

어떤 주장이 맞는지 틀린지 통계적으로 따져보는 과정

💡 가설(hypothesis) = 아직 증명되지 않은 주장

  • 수학적 가설 → 참/거짓으로 딱 떨어지게 판별 가능
  • 통계적 가설100% 확신은 못 하고, '확률적으로 유의미한가'를 보는 것

 

예를들어, 

 A라는 피자집에서,

"우리 피자는 평균적으로 토핑이 10개씩 올라가요! 🍕 " 라고 얘기한다면?

→ 정말 그럴까?

→ 피자를 30판 사서 세어보자! (데이터 모으기)

→ 결과를 바탕으로 주장이 맞는지 확인해 보자!

이게 바로~ 가.설. 검.정.

 

모집단을 직접 관찰할 수 없기 대문에 표본(샘플)을 사용하고,

표본으로 내린 결론에는 항상 오류 가능성이 존재

→ 이 오류를 수치화하고 판단 기준을 만드는 게 가설 검정의 핵심!

 


3. 귀무가설 (H₀) 과 대립가설 (H₁)

구분 예시
귀무가설(H₀) 부정하고 싶은 주장 피자 토핑 평균 = 10개 (피자집 말이 맞다)
대립가설(H₁) 입증하고 싶은 주장 피자 토핑 평균 < 10개 (피자집 말이 틀렸다, 덜 준다!)

 

원칙:

  • 가설 검정은 항상 귀무가설( H₀ )을 기준으로 시작
  • 귀무가설을 기각할 근거가 있으면 → 대립가설(H₁) 채택

4.  유의 수준 (Significance level; α)

유의수준(α)은 "귀무가설이 맞는데도 잘못 기각할 확률"을 의미

  • 다시 말해, 제1종 오류(α)를 허용하는 최대 한계치!
  • 보통 5% (α = 0.05) 또는 1% (α = 0.01)를 사용.

쉽게 말하면: "내가 5% 확률로 틀릴 수도 있지만, 이 정도는 감수할게!"

 

🔥  논문 작성 시:

  • 유의수준 (α) 미리 설정하고, 결과를 그 기준으로 해석
  • p-value < α귀무가설 기각
  • p-value ≥ α귀무가설 채택

5. 제 1종 오류 & 제 2종 오류

가설 검정에는 두 가지 오류 가능성이 있다.

  실제로 H₀ 참 실제로 H₀ 거짓
H₀ 기각   제1종 오류 (α) 옳은 결정 (1- β , 검정력)
H₀ 채택 옳은 결정(1- α)  제2종 오류 (β)

 

제1종 오류 (α): 귀무가설이 맞는데 잘못 기각 

  • 예시: “무죄인데 유죄로 판결” → 억울하게 처벌
  • 유의수준(α): 보통 0.05 (5%) 사용

제2종 오류 (β): 귀무가설이 틀렸는데 기각 못 함

  • 예시: “유죄인데 무죄로 판결” → 범인 놓침
  • β를 줄이면 검정력이 높아짐 (보통 검정력 80% 이상 요구 → β ≤ 0.2)

 

기억하기:

  • α 줄이면 → 신중해짐 (억울한 사람 적음)
  • β 줄이면 → 범인 놓침 줄임
  • 하지만, 둘 다 동시에 줄이긴 어려움.

🔥 논문 포인트:

  • 보통 α = 0.05 사용 (기본적인 유의수준) → 5% 이내로 억울한 기각을 허용
  • 검정력 80% 이상 → 실험 디자인에서 고려해야 함

6. 검정 통계량 (Test Statistic)

귀무가설을 검증하기 위해

표본 데이터와 귀무가설의 모평균 차이를 수치화한 값!

(귀무 가설을 검증하는 기준)

 

Z-검정 공식:

기호 의미 설명
표본 평균(sample mean) 표본 데이터의 평균 값
μ 모평균(population mean) 귀무가설에서 주장하는 모집단 평균
σ 모집단 표준편차(population standard deviation) 모집단 전체의 표준편차
(모를 경우 표본 표준편차 사용)
n 표본 크기(sample size) 표본 데이터의 개수

 

Z 값 해석:

  • Z = 0 → 표본 평균과 귀무가설 평균이 완전히 일치
  • Z 값이 커지거나 작아질수록 → 귀무가설과 차이가 커짐
  • 기준선을 넘으면 → 귀무가설 기각!

🔥 논문 포인트:

  • Z 값만 쓰지 말고, p-value까지 함께 제시!

7.  기각역(Rejection Region)

기각역: 귀무가설을 기각하는 기준선, 유의수준(α)에 따라 결정됨

유의수준(α)에 따른 Z 값 기준선:

유의수준 (α) 단측검정 Z 기준 양측검정 Z 기준
0.10 ±1.28 ±1.645
0.05 ±1.645 ±1.96
0.01 ±2.33 ±2.576
  • 단측검정: 특정 방향으로만 차이를 볼 때 (ex. 토핑이 적은지 확인)
  • 양측검정: 양쪽으로 차이를 확인할 때 (ex. 토핑이 많거나 적은지 둘 다 궁금)

8.  단측 검정 vs 양측 검정

검정방식 대립가설 기각역 사용시기
양측검정 μ ≠ μ₀ |Z| > Z_α/2 평균이 같은지/다른지 비교
단측검정 (오른쪽) μ > μ₀ Z > Zα 특정 방향으로 커졌는지 알고 싶을 때
단측검정 (왼쪽) μ < μ₀ Z < -Zα 특정 방향으로 작아졌는지 알고 싶을 때

 

Z값 기준:

  • α = 0.05 → 단측 Zα = 1.645, 양측 Zα/2 = 1.96
  • α = 0.01 → 단측 Zα = 2.33, 양측 Zα/2 = 2.576

9.   P-value

p-value = "귀무가설이 맞다고 가정했을 때, 관측된 값 이상이 나올 확률"

  • p-value < α → 귀무가설 기각
  • p-value ≥ α → 귀무가설 채택

해석법:

p-value 해석  
p < 0.001 극히 유의함 Extremely significant
p < 0.01 매우 유의함 Highly significant
p < 0.05 유의함 (보통 유의하다 해석하는 기준선) Significant
p < 0.1 약간 유의성 있음
(경향이 있다고 일부 연구에서 해석하기도 하지만, 보수적인 연구에서는 기각 불가)
Marginally significant
p ≥ 0.1
NS or exact p-value
유의하지 않음 (기각 불가) Not significant

 

🔥 논문 작성 팁:

  • p-value는 정확히, 구체적으로 표기: p = 0.032
  • 단순히 “유의하다” 대신, "p < 0.05" 식으로 표현
  • 특정 학회나 분야에서 사용하는 기준을 확인하기

10.  가설 검정의 5단계

 

🎯 문제:

피자집 사장님: "우리 피자는 평균적으로 토핑이 10개씩 올라가요!"

확인을 위해 30판의 피자를 샘플링(n=30)해서 토핑 개수를 세어봄.

- 평균: 9

- 표준편차: 1.5

 

이 때 사장님의 말이 맞는걸까?


✔️ STEP 1: 가설 세우기

  • H₀ (귀무가설): 피자 토핑 평균: → μ = 10
  • H₁ (대립가설): 피자 토핑 평균 → μ < 10 (토핑이 적다고 의심)

 

✔️ STEP 2: 얼마나 차이나는지 계산하기 (Z-값(검정통계량) 구하기)

공식:

 

✔️ STEP 3: 유의수준 설정:

  • α = 0.05 → 단측검정 기준 Z = -1.645

 

✔️ STEP 4: 기각 여부 판단

  • Z = -3.65 < -1.645귀무가설 기각! → 사장님 말 틀렸다!
  • p-value ≈ 0.000130.05보다 훨씬 작음  → 매우 유의미한 결과

(단, 5% 확률로 틀릴 수도 있음 → 이게 α!)

 

논문에서는 이렇게 쓴다:

"표본평균은 9개로, 귀무가설 하에서 관측될 확률은 0.013% (p = 0.00013)로 유의수준 0.05에서 귀무가설을 기각할 수 있었다.


11. 유의수준 vs p-value

유의수준(α) "기각할 기준선" 역할 보통 0.05 사용
p-value "우연히 나올 확률" 작을수록 귀무가설 기각 가능성 ↑

 

p-value = "이 정도 결과가 우연히 나올 확률"

  • p-value < α (0.05)귀무가설 기각
  • p-value ≥ α귀무가설 채택

💡 쉬운 해석:
"이 결과가 그냥 우연히 나올 확률은 0.013%밖에 안 되니까, 사장님 말이 틀려!"


12.  요약표

용어 예시
귀무가설 (H₀) "변화 없음" "이 다이어트 효과 없음"
대립가설 (H₁) "변화 있음" "이 다이어트 효과 있음"
제1종 오류 (α) 억울하게 기각 무죄인데 유죄 판결
제2종 오류 (β) 범인 놓침 유죄인데 무죄 판결
유의수준 (α) 실수 허용 범위 보통 5% (0.05) 사용
p-value 우연히 나올 확률 작을수록 귀무가설 깨기 쉽다
검정통계량 (Z값) 기준점 "얼마나 차이가 나는지"
기각역 "넘어가면 기각" 기준선 넘으면 귀무가설 OUT

💡  TIP:

  1. 귀무가설부터 세워라 → 항상 기본 가정!
  2. p-value와 유의수준 비교 → 작으면(p-value < α) 귀무가설 기각!
  3. "결과가 의미 있는가?"와 "우연일 가능성은 낮은가?"를 구분할 것!