분류 전체보기 43

UK Biobank 데이터를 어떻게 사용할 수 있을까?

UK Biobank(UKB)는 단순히 "좋은 데이터"일 뿐만 아니라,연구자들이 실제로 접근하고 사용할 수 있는 구조를 갖춘 대표적인 공개 코호트다.하지만 처음 접하는 사람에겐“신청은 어디서 하지?”“데이터는 어떻게 받지?”“Field ID는 뭐야?”같은 의문이 생길 수 있다.이번 글에서는 UKB 데이터를 사용하기 위한 실제 흐름을 하나씩 짚어본다.1. 연구자 등록 및 프로젝트 신청UK Biobank는 비영리 목적의 연구자라면 누구나 신청 가능하다.개인 신청이 아니라 소속기관 소속 연구자로 신청해야 하며, 팀 단위 접근도 가능하다.UK Biobank Access Management System 접속https://bbams.ndph.ox.ac.uk/소속 연구기관 등록 + 사용자 계정 생성프로젝트 설명서(Pr..

유전학 2025.04.14

UK Biobank에는 어떤 데이터가 있을까?

UK Biobank에는 어떤 데이터가 있을까?UK Biobank(UKB)는 유전정보부터 생활습관, 병력, 영상, 활동 데이터까지말 그대로 “한 사람의 건강 인생 전체를 담은 코호트”라고 할 수 있다.질병은 유전 + 환경 + 생활습관 + 사회적 요인이 함께 작용하므로이 모든 데이터를 통합해서 분석할 수 있어야 정확한 예측이 가능하다. 그래서 한 명의 데이터를 중심으로 멀티모달 데이터가 구성된 것이UKB가 다른 코호트와 차별화되는 가장 큰 이유다.UKB 데이터 구성카테고리내용비고🧬 Genetic DataGenotyping (500K SNP array), Whole Exome Sequencing (WES), Whole Genome Sequencing (WGS)유전체 기반 질병 연구의 핵심📝 Baseline..

유전학 2025.04.13

UK Biobank는 어떻게 가능했을까?

Bioinformatics를 공부하다 보면, UK Biobank는 진짜 빠질 수가 없다.거의 이 분야의 바이블 같은 존재라고 해야 할까?관련 연구를 접할 기회가 종종 있어, 이번 기회에 짧게 정리해보려고 한다. UK Biobank, 언제 시작됐나?정식 출범: 2006년참여 인원: 약 50만 명대상: 영국 전역의 40~69세 사이 일반인데이터: 유전체 + 생활습관 + 병력 + 환경 + 건강기록 + 영상 + 사망 및 암등록 등어떻게 그런 방대한 프로젝트가 가능했을까?UK Biobank가 가능했던 배경은 단순히 “과학을 위한 열정”뿐만 아니라, 정치적, 사회적 신뢰, 기술적 흐름(데이터 수집 인프라)이 맞물렸기 때문이다.“만성질환을 예방하려는 국가 정책 + NHS 기반의 데이터 시스템 +과학기술 발전 + 공공..

유전학 2025.04.12

진심이 담긴 사과의 중요성

최근 온라인 쇼핑을 하다가 불쾌한 일을 겪었다.정말 말도 안 되는 일이었는데, 너무 길어지지 않게 짧게 요약하자면,1차 배송: 하자품 수령2차 교환품: 또 다른 하자3차 시도: A/S기사가 와서 부품 교체하기로 했지만, 방문해서는 “부품 교체 불가”, 다른 부품에서 녹 발견...그에 대해 업체에 문의를 했는데, 일주일이 지나 돌아온 말은“고객님이 기대치를 충족시켜드리기 힘들다”는 식의 대응이었다.…네?  그래서 지금까지의 내역을 정리해서 보내고, 업체의 입장을 물었더니 돌아온 답변은 한 줄. '네 참고하겠습니다' 였다. ...^^;업체에서 대응한 내용은 사과가 아니라 회피였다.계속해서 내 탓을 했다.아니... 부품이 누락된 물건을 받고, 교환품으로 부품이 녹슨 물건을 받은 게 제 기대가 잘못된 탓이 아니..

💡Lightbulb 2025.04.11

비오틴 사태로 바라본 과학과 유사과학 그 사이

탈모, 손발톱 깨짐이나 찢어짐에 대한 걱정으로, 작년부터 비오틴을 챙겨 먹기 시작했다.원래 구입했던 비오틴이 거의 소진되어가서, 최근에는 맥주효모+비오틴 제품을 추가로 구매했다.그런데 구매한 지 며칠 되지도 않아, 뉴스에서 충격적인 보도를 접했다.‘맥주효모+비오틴’이 탈모 예방에 아무런 과학적 근거가 없으며,일부 제품은 검증되지 않은 주장을 내세워 광고를 하고 있었고,심지어 어떤 제품은 표기된 함량의 10%밖에 성분이 들어 있지 않았다는 것이다.대대적인 보도였다.  그 뉴스를 본 나는 정말 당황스러웠다.나에게 맥주효모와 비오틴이 모발 건강에 도움이 된다는 건, 의심할 여지 없이 ‘진실’처럼 느껴졌기 때문이다.맥주효모가 머리카락에 좋다는 이야기를 처음 들은 건 10년도 더 전의 일이다.체코의 어떤 맥주 공..

💡Lightbulb 2025.04.10

모델 평가 방법(Cross Validation + Bootstrap)

어떤 모델을 만들면, 데이터를 넣어서 학습을 하고, 그 성능을 평가를 해야 한다.하지만 이 학습과 평가 과정을 단 한번 수행한다면,그 결과가 운인이 실력인지 알기 어렵다.그래서 우리는 평가를 여러 번 반복하는 전략을 쓴다. Cross Validation과 Bootstrap 방식이 대표적이다. Cross Validation은 모델이 새로운 데이터라 얼마나 잘 작동하는지를 확인하는 성능 일반화를 확인하는데 초점이 있,Bootstrap은 불확실성 평가와 신뢰구간 추정에 초점이 있다. 따라서,Cross Validation은 여러개의 학습/검증 셋을 나눠 모델 일반화의 성능을 평가하고,Bootstrap은 여러 개의 무작위 샘플을 (중복 허용) 생성하여 신뢰 구간을 추정한다.모델 평가 방법├── Cross Vali..

AI&ML 2025.04.09

질문은 때로 대답보다 오래 남아

우리는 이제 AI가 일상에 깊숙이 스며든  '대 AI 시대'에 살고 있다.매일 AI와 대화하고, AI에게 배우고, 심지어 AI에게 상담을 받는다.나에게 먼저 ‘AI’라는 개념을 각인시킨 건,어린 시절에 본 영화 Artificial Intelligence(2001, 감독: 스티븐 스필버그)였다.그때 나는 Dr. Know라는 AI가 등장하는 장면에서 깊은 인상을 받았다.그가 모든 정보를 알고 있지만,정확한 질문을 던지지 않으면 원하는 답을 얻을 수 없다는 사실을 깨달았기 때문이다. 최근 ChatGPT를 정말 자주 사용하면서,Dr. Know의 모습이 계속 떠오른다.David가 푸른 요정을 찾기 위해 질문을 던진 장면이,내가 ChatGPT에게 무엇을 물어야 가장 좋은 답을 얻을 수 있을까 고민하는 모습과 겹쳤기..

💡Lightbulb 2025.04.08

영어 논문 시제(Tense) 사용 가이드

1. Abstract (초록)과거 시제로 연구 방법과 결과를 설명하고,현재 시제로 의미, 결론, 영향을 정리 📖 실제 논문 예시:"We performed network and single-cell analyses to identify molecular mechanisms and therapeutic targets in glioblastoma multiforme." (과거 시제 – 연구 수행)"These findings suggest potential therapeutic strategies..." (현재 시제 – 연구 의의) (Molecular mechanisms and therapeutic targets in glioblastoma multiforme, Nature, 2022)2. Introducti..

스코핑? 시스테믹? 그게 뭐야? 🙄 | 논문 종류

1.  "너 그거 스코핑 리뷰는 해 봤어?" 연구 주제에 대한 고민을 하던 중, 친구가 나한테 그랬다.  "너 그거 스코핑은 찾아 봤어? 시스테믹도 찾아봐!" ...스코핑? 뭐라고? 시스테믹...?내가 아는건 scope(범위) 밖에 없는데... 나는 처음 듣는 단어인데...?!스코핑이 대체 뭔데? 스코핑이 논문 종류라고 한다.리뷰 논문은 들어봤는데, 스코핑은 뭐야? 시스테믹은 뭐고? 아직 논문의 종류도 잘 모르는 나... (휴 =3 )그래서 내가 몰랐던 논문의 종류에 대해 정리해봤다.  2. 학술 논문 종류 정리1. Articles (Full Papers)가장 기본적인 연구 논문. 실험 설계, 결과, 해석이 다 들어간 '풀코스 요리' 같은 느낌.입문자에겐 내용이 방대해서 처음부터 보기엔 다소 버거울 수도..

기록: 감정은 바뀌고 기억은 흐려져도, 기록은 남는다. (나를 정확하게 아는 방법)

https://youtu.be/uJscKaLl8OQ?si=zXWkNbqxEYI5JKnF 데이터 기반으로 '나'를 이해하기기록은 개선의 출발점이다.기록하지 않으면 자신을 정확히 알 수 없습니다.일간 → 주간 → 월간 → 연간 회고 순으로 회고를 쌓아가자.회고에는 시간대별 활동, 감정 상태 등을 기록하며, 행복, 인간관계, 건강 등 카테고리별 분석을 포함하는 것이 좋다.기억은 흐릿하지만 기록은 정확하므로, 자기 자신을 과대평가하거나 과소평가하지 않고 데이터 기반으로 나를 이해할 수 있다.기록을 기반으로 계획을 세우면 더 현실적이고 지속 가능한 습관을 만들 수 있다.성공적인 습관은 타인의 조언이 아닌 나만의 성공 경험에서 배우는 것이 더 효과적이다. ⭐스프레드시트를 활용하면 검색과 분석이 용이하며, 장기적인 ..

💡Lightbulb 2025.04.05