인과추론

[인과추론] 인과를 증명하기 위해 RCT가 중요한 이유

Jin_Omics 2025. 4. 23. 11:45

1. 연관 ≠ 인과

두 변수 사이에 통계적으로 함께 움직이는 경향이 있다고 해서, 꼭 원인-결과 관계가 있는 건 아니다.

 

예를 들어, 아이스크림 판매량과 익사 사고 수가 함께 늘어난다고 해서, 아이스크림이 익사의 원인이라고 말하긴 어렵다. 여름이라는 공통 원인(Confounder) 때문이다.

 

2. 인과란 무엇인가?

우리가 알고 싶은 건 진짜 원인, 즉 "T를 바꿨을 때 Y가 바뀌는가?"에 대한 답이다.
이를 인과 효과(Causal Effect)라고 부른다.

인과(Causal Effect) = ATT (Average Treatment effect on the Treated)
 

즉, 처치를 받은 집단에 대해 그 처치가 없었더라면 나왔을 결과실제 결과의 차이를 말한다.

하지만 현실에서는 이런 비교가 어렵다.
왜냐면… 우리는 한 사람에게 동시에 처치를 하고 안 하고 결과를 볼 수 없기 때문이다.

 

3. 연관 vs 인과 – 수식으로 표현하면?

보통 우리가 관찰하는 데이터에는 편향(BIAS)이 섞여 있다.

그래서 우리가 보는 연관성은 이렇게 나뉜다:

연관 = ATT + BIAS
인과 = ATT

 

즉, BIAS가 없을 때만, 연관 = 인과 가 된다.
그래서 관건은 어떻게 이 BIAS를 없애느냐!! 다.

 

4. 오늘의 주제: 무작위 실험 (RCT)

무작위 실험(Randomised Experiments) 또는 RCT(Randomised Controlled Trials)

는 BIAS를 줄이기 위한 가장 강력한 방법이다.

이제 간편하게 RCT라고 서술하겠다.

 

RCT는 개개인을 무작위처치군(Treatment group)과 대조군(Control group)으로 나누는 방식이다.

이렇게 하면 T와 관련된 잠재적 혼란 요인들(confounders)이 고르게 섞인다. 

그 결과, T와 (Y₀, Y₁)서로 독립인 상태가된다.
수식: (Y₀, Y₁)T

이는 처치 여부(T)가 잠재 결과(Y₀, Y₁)와 무관하다는 뜻이다.

즉, T가 결과에 영향을 준 유일한 요인이라는 의미가 된다.
이때 우리는 BIAS가 제거되었기 때문에, 관찰된 결과 = 인과효과 라고 볼 수 있다.

 

5. 그럼 ATE는 뭐지?

RCT 얘기할 때 자주 나오는 개념 중 하나가 바로 ATE

  • ATT: 처치받은 사람들에게만 적용된 인과 효과
  • ATE: 전체 모집단에 대한 평균 인과 효과 (Average Treatment Effect)

예시: 

전체 사람들에게 약을 줬을 때 효과(ATE)와,  
이미 약을 받은 사람들만 따졌을 때의 효과(ATT)는 다를 수 있다.

 

즉, ATE는 모든 사람에게 처치를 했을 때 기대되는 평균 효과를 의미한다.

보통 RCT가 잘 설계되면 ATT와 ATE는 거의 같아진다.

 

6. 현실에서는 RCT가 쉽지 않다

과학자들이 가장 선호하는 인과 추론 방법은 바로 잘 설계된 RCT다.
하지만 RCT는 모든 상황에 적용하기 어렵다.
왜냐하면…

  • 💰 비용이 많이 들고,
  • ⚖️ 윤리적인 문제가 있고,
  • 🧪 현실적으로 실행 불가능한 실험도 많다.

예: 흡연이 건강에 나쁜지 알고 싶다고 해서 일부러 사람들에게 담배를 피우게 할 수 없다.

그래서 등장하는 것이 준실험적 방법(Quasi-experimental Methods)이다.

 

Image created with AI · Curated by JINetic CODE

 

7. Confounder란?

Confounder (혼란 변수)는
T와 Y에 모두 영향을 주는 제3의 변수다.
이 변수가 존재하면, 우리가 관찰한 T와 Y의 관계가 왜곡 될 수 있다.


그래서 Confounder를 제거해야 하는데,

회귀식에 포함시켜 통제(Control)하는 방식으로 제거하거나,

RCT에서는 무작위 배정을 통해 자동으로 제거할 수 있다.


🔖 용어 정리

개념 의미 예시/비고
Association 함께 움직이는 경향 원인일 수도, 아닐 수도
Causation T가 Y를 직접 변화시킴 T만 바꿨을 때 Y가 바뀌면 인과
BIAS 연관과 인과의 차이 제3의 요인 때문
ATT 처치받은 사람들에 대한 인과효과 Treatment group만
ATE 전체 인구에 대한 인과효과 ATT보다 넓은 개념
RCT BIAS 제거를 위한 실험 방법 무작위 분배가 핵심

 

'인과추론' 카테고리의 다른 글

[인과추론] 편향(Bias) 이란?  (0) 2025.03.10
[인과추론] Notation 101  (0) 2025.03.09
인과추론(Causal Inference)란 무엇일까?  (0) 2025.03.08