전체 글 44

UK Biobank 분석의 주요 한계와 주의 사항

UK Biobank(UKB)는 방대한 데이터를 제공하지만,“데이터가 크다고 분석이 곧 정답이 되지는 않는다.”이 말은 UKB 분석을 시작하는 모든 연구자가 기억해야 할 첫 번째 원칙이다. 이번 글에서는 UKB 데이터를 분석할 때 반드시 유의해야 할 핵심 포인트를 정리해본다. 1. 선택 편향 (Selection Bias)UKB 참여자는 모두 자발적으로 모집된 일반인이다.→ 따라서 전 국민을 대표하는 무작위 샘플이 아니다! ⚠️ 예를 들어:건강에 관심이 많은 사람일수록 참여 확률이 높음영국의 특정 지역/계층에 편중될 수 있음📌 이로 인해 특정 질병이나 행동 특성이 과소/과대추정될 가능성이 있다.✔ 분석 결과를 일반 인구집단에 적용할 때는 주의,✔ 외부 검증 세트와 비교하거나, 가중치(weighting) 사..

유전학 2025.04.15

UK Biobank 데이터를 어떻게 사용할 수 있을까?

UK Biobank(UKB)는 단순히 "좋은 데이터"일 뿐만 아니라,연구자들이 실제로 접근하고 사용할 수 있는 구조를 갖춘 대표적인 공개 코호트다.하지만 처음 접하는 사람에겐“신청은 어디서 하지?”“데이터는 어떻게 받지?”“Field ID는 뭐야?”같은 의문이 생길 수 있다.이번 글에서는 UKB 데이터를 사용하기 위한 실제 흐름을 하나씩 짚어본다.1. 연구자 등록 및 프로젝트 신청UK Biobank는 비영리 목적의 연구자라면 누구나 신청 가능하다.개인 신청이 아니라 소속기관 소속 연구자로 신청해야 하며, 팀 단위 접근도 가능하다.UK Biobank Access Management System 접속https://bbams.ndph.ox.ac.uk/소속 연구기관 등록 + 사용자 계정 생성프로젝트 설명서(Pr..

유전학 2025.04.14

UK Biobank에는 어떤 데이터가 있을까?

UK Biobank에는 어떤 데이터가 있을까?UK Biobank(UKB)는 유전정보부터 생활습관, 병력, 영상, 활동 데이터까지말 그대로 “한 사람의 건강 인생 전체를 담은 코호트”라고 할 수 있다.질병은 유전 + 환경 + 생활습관 + 사회적 요인이 함께 작용하므로이 모든 데이터를 통합해서 분석할 수 있어야 정확한 예측이 가능하다. 그래서 한 명의 데이터를 중심으로 멀티모달 데이터가 구성된 것이UKB가 다른 코호트와 차별화되는 가장 큰 이유다.UKB 데이터 구성카테고리내용비고🧬 Genetic DataGenotyping (500K SNP array), Whole Exome Sequencing (WES), Whole Genome Sequencing (WGS)유전체 기반 질병 연구의 핵심📝 Baseline..

유전학 2025.04.13