2025/03 14

Foundation Model

Foundation Model이 뭘까?뭐가 파운데이션 모델이라는데 무슨 말인지 하나도 못 알아 듣겠다.  그래서 공부해본다.  파.운.데.이.션. 모.델.(화장품 아님... ) 1. Foundation Model = '기초가 되는 모델'‘Foundation’은 ‘기초, 토대’라는 뜻이다. 즉, Foundation Model은 다양한 AI 작업의 기반이 되는 범용 모델을 말한다.한 가지 작업만 하는 모델이 아니라,한 번 거대한 데이터로 훈련하면→ 그 모델을 바탕으로 여러 작업에 재활용할 수 있다! 2. 예전에는...옛날엔 이런 식이었다:감정 분석 모델 = 감정 데이터로 새로 학습번역 모델 = 번역 데이터로 새로 학습이미지 분류 모델 = 이미지로 새로 학습작업마다 전용 모델을 따로 만들고 훈련시켜야 했다. ..

AI&ML 2025.03.31

Population Stratification

1. Population Stratification 이란?질병과 관련 없는 유전적 배경 차이가 집단 내에 존재하면서,SNP와 질병 사이에 가짜 연관(fake association)이 나타나는 현상이다.→ GWAS에서 꼭 보정해야 할 중요한 교란 요인(confounder)!2. 예시로 이해하기연구자가 다음과 같이 실험했다고 상상해보자:A 지역 사람 1,000명 → 모두 사과를 좋아함B 지역 사람 1,000명 → 모두 사과를 싫어함이들의 키와 SNP 정보를 수집그리고 분석 결과, rs0000이라는 SNP가 A 지역 사람들에게 더 많았다.연구자는 이 SNP가 ‘사과 선호’와 관련 있다고 발표했다.Population group (지역 차이) → SNP(rs0000) →  Preference (사과 선호)❗..

유전학 2025.03.30

Pre-imputation QC

0. Imputation이란?Imputation은 유전체 데이터에서 빠진 genotype 정보를 예측해 채워주는 과정이다.예를 들어 array-based genotyping에서는 측정되지 않은 SNP들이 존재하는데,이를 reference panel을 활용해 통계적으로 추정해 보완한다.이로 인해 분석 가능한 variant 수가 크게 증가하고, meta-analysis 호환성도 향상된다.  1. Pre-imputation QC란?Pre-imputation QC는 Imputation시행 전(pre-) 진행되는 Quality Control을 시행하는 단계다.이 과정의 목적은 신뢰도 높은 clean dataset을 만드는 것이다.Imputation을 시행 전 미리 데이터를 점검함으로써 오류나 bias 발생 가능성..

카테고리 없음 2025.03.29

[Python] 그냥 코딩 vs 함수 vs 클래스

“파이썬에서는 클래스가 T.O.P다...”1. Python은 대표적인 객체 지향 언어 🧠Python은 사물처럼 생각하고, 그 사물을 코드로 표현하는 객체 지향(Object-Oriented) 언어다. 쉽게 말해,“현실에 있는 걸 코드로 만들고, 그 안에 정보와 기능을 담는 방식” 예를 들어 알람 시계를 만든다면?시간, 반복 여부는 정보(속성)알람을 울리는 건 기능(동작)→ 이걸 하나로 묶은 게 바로 클래스!2. 그냥 코딩 vs 함수 vs 클래스 🧩알람 설정을 예시로 비교보자 ⏰  ✅ 그냥 코딩 (절차형)print("알람 앱 실행")print("07:00 설정")print("반복: 매일")print("저장") 한 번만 쓸 땐 괜찮지만,여러 개의 알람이 필요하면… 복붙 지옥이 펼쳐질 것이다.✅ 함수 사용d..

Python 2025.03.28

신규 연구 활동 종사자 안전 교육

신규 연구활동종사자 안전교육에 다녀왔다. 연구실 안전환경 조성에 관한 법률에 따라,과학기술 분야 연구활동종사자들은 매 학기마다 안전교육을 이수해야 한다. 매 학기 온라인으로도 이수가 가능하지만,특히 신규 연구활동종사자(대학원생)의 경우에는 오프라인 집체 교육을 권장한다.(참고로, 오프라인 참석이 불가능할 경우에는 온라인으로 대체할 수 있다!) SAIHST는 자연과학캠퍼스 소속이지만, 캠퍼스가 일원역에 있다.하지만 신규 연구활동종사자 안전교육은 아쉽게도 일원역이 아닌 수원에 있는 자연과학캠퍼스에서 진행된다.그래서 온라인 교육 이수의 유혹이 정말 강렬했다. 개강하고 나서 계속 일원역 근처에서만 지내다 보니,이 참에 공식적으로(!?) 외출할 수 있는 기회라고 생각했고,또 온라인과 오프라인 교육이 어떻게 다른지..

대학원이야기 2025.03.27

크리스퍼 가위와 특허 전쟁

누가 과학을 발견하고, 누가 그 권리를 가져가는가1. 크리스퍼 가위란?크리스퍼(CRISPR)는 원래 박테리아의 면역 시스템에서 유래한 메커니즘이다.바이러스가 침입했을 때, 그 유전 정보를 기억하고 다음에 같은 바이러스가 들어오면 잘라내어 방어하는 방식이다. 이 시스템을 기반으로 한 유전자 편집 기술이 바로 크리스퍼-Cas9, 일명 크리스퍼 가위이다.이 기술은 기존의 유전자 편집 기술보다 훨씬 간단하고 정확하며 비용도 적게 든다는 점에서 큰 혁신으로 평가받는다. 원하는 DNA 서열을 정확하게 잘라내고 편집할 수 있기 때문에, 유전 질환 치료, 작물 개량, 암 연구 등 다양한 분야에서 활용 가능성이 열려 있다. 2. 크리스퍼 가위를 둘러싼 특허 전쟁하지만 이 혁신적인 기술을 둘러싸고는 치열한 특허 전쟁이 벌..

유전학 2025.03.23

학생증 발급

학생증을 발급받았다.3월에 학교 홈페이지에 학생증 발급에 대한 안내가 올라왔고,우리은행(우리WON뱅킹)을 이용해 학생증을 발급받는다.- 이렇게 우리은행 어플리케이션을 다운받게 되었고, 우리은행은 고객을 1명 확보하게 된...건가?! 대학원은 학부생들보다 하루 늦게 신청이 가능했다.삼성융합의과학원은 실제로 일원역 캠퍼스에 있지만,공식적으로는? 자연과학 캠퍼스 소속인지 학생증 발급받을때 학교 이름에 '성균관대 자과(캠)'으로 설정해야 내 학번 조회에 성공한다. 신청 후 거의 1주일 정도만에 학생증이 우편으로 도착했다.앞면보고 너무 예뻐서 깜짝 놀랐는데,떼어서 뒷면을 보자마자 너무 못생겨서 한 번 더 놀랐다. ^^; 개인정보가 많이 기록되어있어 굳이 사진 업로드는 하지 않을 것이다.(하지만, 뒷면은 대체 왜...

대학원이야기 2025.03.15

[Python] for loop로 목차 만들기

정말 별거 아니지만,[index no.] + [컬럼명] 으로 목차 만드려는데 귀찮아서 for loop문으로 돌리기로 목차번호 0번부터import pandas as pd# CSV 파일 가져오기.df = pd.read_csv("dataset.csv")# DataFrame의 "인덱스. 컬럼명"을 출력하는 코드(0번부터)for i, col in enumerate(df.columns): print(f"{i}. {col}") 목차번호 1번부터import pandas as pd# CSV 파일 가져오기.df = pd.read_csv("dataset.csv")# DataFrame의 "인덱스. 컬럼명"을 출력하는 코드(1번부터)for i, col in enumerate(df.columns, start=1): p..

Python 2025.03.12

박테리아가 바이러스 DNA를 가짐?

https://youtu.be/6tw_JVz_IEc?si=7q5LgtKcSnz7yMv-  1. 박테리아 vs 바이러스: 싸움의 시작박테리아는 세균이고, 바이러스는 세균을 감염시켜 증식하는 존재다.예를 들어, 감기 바이러스가 사람에게 들어오면 면역 체계가 이를 감지하고 백혈구들이 바이러스를 제거한다. 이처럼 생명체는 외부에서 침입한 병원체를 방어하는 시스템을 갖추고 있다. 박테리아도 마찬가지다.박테리오파지(바이러스)는 박테리아를 공격해서 자기 유전자를 주입하고 증식하려고 한다. 이에 대응하기 위해 박테리아는 자신만의 면역 시스템을 만들었는데, 그게 바로 크리스퍼(CRISPR) 시스템이다.2. 박테리아가 바이러스 유전자를 저장하는 이유💡 우리 몸의 면역 시스템과 비슷한 원리! 사람은 한 번 감기에 걸리면,..

유전학 2025.03.11

[인과추론] 편향(Bias) 이란?

우리는 착각할 준비가 되어있다.비싼 카메라를 사용한 사람들이 찍은 사진이 더 멋져 보인다.따라서, 비싼 카메라를 쓰면 (누구나) 사진을 더 잘 찍는다. 우리는 쉽게 착각한다.카메라 가격과 결과물만 놓고 보면 이(위의) 말은 참(True)으로 보인다. 하지만, 정말 카메라 가격이 사진 실력의 원인일까? 전문 사진작가들은 대부분 고가의 카메라를 사용한다.그렇다면, 그들은 비싼 카메라 덕분에 사진을 잘 찍는 걸까?아니면 원래 사진을 잘 찍는 사람들이 비싼 카메라를 선택하는 걸까? 사실, 사진을 잘 찍는 사람들이 더 좋은 장비에 투자할 가능성이 높다.아무리 비싼 카메라를 쓴다고 해도 촬영 기술, 구도, 색감 조절 능력이 부족하면 좋을 사진을 찍기 어렵다.즉, 카메라의 가격이 아니라, 원래 사진을 잘 찍는 사람인..

인과추론 2025.03.10