ukb 3

UK Biobank 분석의 주요 한계와 주의 사항

UK Biobank(UKB)는 방대한 데이터를 제공하지만,“데이터가 크다고 분석이 곧 정답이 되지는 않는다.”이 말은 UKB 분석을 시작하는 모든 연구자가 기억해야 할 첫 번째 원칙이다. 이번 글에서는 UKB 데이터를 분석할 때 반드시 유의해야 할 핵심 포인트를 정리해본다. 1. 선택 편향 (Selection Bias)UKB 참여자는 모두 자발적으로 모집된 일반인이다.→ 따라서 전 국민을 대표하는 무작위 샘플이 아니다! ⚠️ 예를 들어:건강에 관심이 많은 사람일수록 참여 확률이 높음영국의 특정 지역/계층에 편중될 수 있음📌 이로 인해 특정 질병이나 행동 특성이 과소/과대추정될 가능성이 있다.✔ 분석 결과를 일반 인구집단에 적용할 때는 주의,✔ 외부 검증 세트와 비교하거나, 가중치(weighting) 사..

유전학 2025.04.15

UK Biobank에는 어떤 데이터가 있을까?

UK Biobank에는 어떤 데이터가 있을까?UK Biobank(UKB)는 유전정보부터 생활습관, 병력, 영상, 활동 데이터까지말 그대로 “한 사람의 건강 인생 전체를 담은 코호트”라고 할 수 있다.질병은 유전 + 환경 + 생활습관 + 사회적 요인이 함께 작용하므로이 모든 데이터를 통합해서 분석할 수 있어야 정확한 예측이 가능하다. 그래서 한 명의 데이터를 중심으로 멀티모달 데이터가 구성된 것이UKB가 다른 코호트와 차별화되는 가장 큰 이유다.UKB 데이터 구성카테고리내용비고🧬 Genetic DataGenotyping (500K SNP array), Whole Exome Sequencing (WES), Whole Genome Sequencing (WGS)유전체 기반 질병 연구의 핵심📝 Baseline..

유전학 2025.04.13

UK Biobank는 어떻게 가능했을까?

Bioinformatics를 공부하다 보면, UK Biobank는 진짜 빠질 수가 없다.거의 이 분야의 바이블 같은 존재라고 해야 할까?관련 연구를 접할 기회가 종종 있어, 이번 기회에 짧게 정리해보려고 한다. UK Biobank, 언제 시작됐나?정식 출범: 2006년참여 인원: 약 50만 명대상: 영국 전역의 40~69세 사이 일반인데이터: 유전체 + 생활습관 + 병력 + 환경 + 건강기록 + 영상 + 사망 및 암등록 등어떻게 그런 방대한 프로젝트가 가능했을까?UK Biobank가 가능했던 배경은 단순히 “과학을 위한 열정”뿐만 아니라, 정치적, 사회적 신뢰, 기술적 흐름(데이터 수집 인프라)이 맞물렸기 때문이다.“만성질환을 예방하려는 국가 정책 + NHS 기반의 데이터 시스템 +과학기술 발전 + 공공..

유전학 2025.04.12