1. 연관 ≠ 인과
두 변수 사이에 통계적으로 함께 움직이는 경향이 있다고 해서, 꼭 원인-결과 관계가 있는 건 아니다.
예를 들어, 아이스크림 판매량과 익사 사고 수가 함께 늘어난다고 해서, 아이스크림이 익사의 원인이라고 말하긴 어렵다. 여름이라는 공통 원인(Confounder) 때문이다.
2. 인과란 무엇인가?
우리가 알고 싶은 건 진짜 원인, 즉 "T를 바꿨을 때 Y가 바뀌는가?"에 대한 답이다.
이를 인과 효과(Causal Effect)라고 부른다.
즉, 처치를 받은 집단에 대해 그 처치가 없었더라면 나왔을 결과와 실제 결과의 차이를 말한다.
하지만 현실에서는 이런 비교가 어렵다.
왜냐면… 우리는 한 사람에게 동시에 처치를 하고 안 하고 결과를 볼 수 없기 때문이다.
3. 연관 vs 인과 – 수식으로 표현하면?
보통 우리가 관찰하는 데이터에는 편향(BIAS)이 섞여 있다.
그래서 우리가 보는 연관성은 이렇게 나뉜다:
즉, BIAS가 없을 때만, 연관 = 인과 가 된다.
그래서 관건은 어떻게 이 BIAS를 없애느냐!! 다.
4. 오늘의 주제: 무작위 실험 (RCT)
무작위 실험(Randomised Experiments) 또는 RCT(Randomised Controlled Trials)
는 BIAS를 줄이기 위한 가장 강력한 방법이다.
이제 간편하게 RCT라고 서술하겠다.
RCT는 개개인을 무작위로 처치군(Treatment group)과 대조군(Control group)으로 나누는 방식이다.
이렇게 하면 T와 관련된 잠재적 혼란 요인들(confounders)이 고르게 섞인다.
그 결과, T와 (Y₀, Y₁)가 서로 독립인 상태가된다.
수식: (Y₀, Y₁) ⫫ T
이는 처치 여부(T)가 잠재 결과(Y₀, Y₁)와 무관하다는 뜻이다.
즉, T가 결과에 영향을 준 유일한 요인이라는 의미가 된다.
이때 우리는 BIAS가 제거되었기 때문에, 관찰된 결과 = 인과효과 라고 볼 수 있다.
5. 그럼 ATE는 뭐지?
RCT 얘기할 때 자주 나오는 개념 중 하나가 바로 ATE
- ATT: 처치받은 사람들에게만 적용된 인과 효과
- ATE: 전체 모집단에 대한 평균 인과 효과 (Average Treatment Effect)
예시:
전체 사람들에게 약을 줬을 때 효과(ATE)와,
이미 약을 받은 사람들만 따졌을 때의 효과(ATT)는 다를 수 있다.
즉, ATE는 모든 사람에게 처치를 했을 때 기대되는 평균 효과를 의미한다.
보통 RCT가 잘 설계되면 ATT와 ATE는 거의 같아진다.
6. 현실에서는 RCT가 쉽지 않다
과학자들이 가장 선호하는 인과 추론 방법은 바로 잘 설계된 RCT다.
하지만 RCT는 모든 상황에 적용하기 어렵다.
왜냐하면…
- 💰 비용이 많이 들고,
- ⚖️ 윤리적인 문제가 있고,
- 🧪 현실적으로 실행 불가능한 실험도 많다.
예: 흡연이 건강에 나쁜지 알고 싶다고 해서 일부러 사람들에게 담배를 피우게 할 수 없다.
그래서 등장하는 것이 준실험적 방법(Quasi-experimental Methods)이다.
7. Confounder란?
Confounder (혼란 변수)는
T와 Y에 모두 영향을 주는 제3의 변수다.
이 변수가 존재하면, 우리가 관찰한 T와 Y의 관계가 왜곡 될 수 있다.
그래서 Confounder를 제거해야 하는데,
회귀식에 포함시켜 통제(Control)하는 방식으로 제거하거나,
RCT에서는 무작위 배정을 통해 자동으로 제거할 수 있다.
🔖 용어 정리
개념 | 의미 | 예시/비고 |
Association | 함께 움직이는 경향 | 원인일 수도, 아닐 수도 |
Causation | T가 Y를 직접 변화시킴 | T만 바꿨을 때 Y가 바뀌면 인과 |
BIAS | 연관과 인과의 차이 | 제3의 요인 때문 |
ATT | 처치받은 사람들에 대한 인과효과 | Treatment group만 |
ATE | 전체 인구에 대한 인과효과 | ATT보다 넓은 개념 |
RCT | BIAS 제거를 위한 실험 방법 | 무작위 분배가 핵심 |
'인과추론' 카테고리의 다른 글
[인과추론] 편향(Bias) 이란? (0) | 2025.03.10 |
---|---|
[인과추론] Notation 101 (0) | 2025.03.09 |
인과추론(Causal Inference)란 무엇일까? (0) | 2025.03.08 |