대학원이야기/연구의 세계

A는 B의 'proxy'다.

Jin_Omics 2025. 4. 20. 13:56

대학원에 들어가기 전엔, 일상에서 proxy라는 단어를 사용한 표현을 들어본 적이 없다.

 

아! proxy server라는 말을 들어본 적은 있다.

...근데 의미도 모르고, 그냥 그렇게 부르다보다~ 하고 넘어갔지.

 

그런데, 대학원에 입학하니 proxy라는 표현을 종종 듣게된다.

'A는 B의 proxy다'라고 주로 표현하는데,

무슨... 말인지 도저히 알아들을 수 없었다.

 

네...?

 

우.. 우선 proxy server부터 알아보자.

 

Proxy server는 뭘까?

‘Proxy server’는 컴퓨터 네트워크에서 사용자와 서버 사이에 중계 역할을 하는 서버를 말한다.
즉, 사용자가 직접 서버에 접근하지 않고, proxy(프록시)를 거쳐서 간접적으로 연결하는 방식이다.

 

이 개념을 생각해보면 ‘대리’, ‘중간자’, ‘대신하는 것’이라는 의미가 확실해진다.

 

연구에서의 proxy는 또 뭘까?

이제 연구 이야기로 돌아가면,
“proxy”는 어떤 현상을 직접 측정하거나 관찰할 수 없을 때,
그걸 대신해서 가늠할 수 있는 다른 변수나 지표를 뜻한다.

 

한국어로는 '대리 변수'라고 하는데, 아니 이런 한국말이 있다고?

 

아무튼,

 

‘A는 B의 proxy다’는 말은,

결국 A를 통해 B를 간접적으로 추정하거나 이해한다는 뜻이다.

 

예를 들어,

  • BMI는 비만의 proxy다 → 체지방률을 정확히 측정하긴 어렵지만, BMI로 대략적인 수준을 가늠할 수 있다.
  • 혈압은 심혈관 질환 위험의 proxy다 → 직접적으로 질환이 있는지 확인하기 전, 혈압 수치로 위험도를 예측한다.
  • 식품 구매 내역은 건강 행동의 proxy로 사용될 수 있다 → 사람들의 식습관을 설문 대신 구매 기록으로 유추한다.
  • 출퇴근 시간은 스트레스 수준의 proxy일 수 있다 → 장시간 통근이 스트레스에 영향을 준다는 전제를 바탕으로.

이런 식으로, 완벽하진 않지만 대신 쓸 수 있는 지표를 proxy라고 한다.

 

 

Image created with AI · Curated by JINetic CODE

점점 익숙해 지겠지?

나는 이런 표현을 대학원 들어오기 전까지 들어본 적도, 써본 적도 없었다.

하지만 지금은 논문 읽기, 연구 설계, 변수 선택할 때 빠질 수 없는 개념이 라는 걸 알게 되었다.


특히 인과추론이나 통계모델링에서 ‘proxy variable’ 개념은 아주 중요하게 등장한다.

 

예를 들어,
어떤 변수는 confounder가 아니라 proxy일 수도 있고,
측정 오류(measurement error)가 있는 proxy variable은 인과 추정에 영향을 미치기도 한다.

 

대학원에 입학하고 느낀 것 중 하나는,

이런 '연구에 쓰이는 언어'들에 먼저 익숙해져야 한다는 것이다.

이런 언어적 장벽 때문에 한국어도, 영어도 도통 진도가 나가질 않는다. ^^!

 

그래도... 차차 나아지겠지?