AI&ML

Foundation Model

Jin_Omics 2025. 3. 31. 14:30

Foundation Model이 뭘까?

뭐가 파운데이션 모델이라는데 무슨 말인지 하나도 못 알아 듣겠다.

 

Image created with AI · Curated by JINetic CODE

 

그래서 공부해본다. 

 

파.운.데.이.션. 모.델.

(화장품 아님... )

 


1. Foundation Model = '기초가 되는 모델'

‘Foundation’은 ‘기초, 토대’라는 뜻이다.

 

즉, Foundation Model은 다양한 AI 작업의 기반이 되는 범용 모델을 말한다.
한 가지 작업만 하는 모델이 아니라,
한 번 거대한 데이터로 훈련하면
그 모델을 바탕으로 여러 작업에 재활용할 수 있다!

 


2. 예전에는...

옛날엔 이런 식이었다:

  • 감정 분석 모델 = 감정 데이터로 새로 학습
  • 번역 모델 = 번역 데이터로 새로 학습
  • 이미지 분류 모델 = 이미지로 새로 학습

작업마다 전용 모델을 따로 만들고 훈련시켜야 했다.

 


3. 지금은?

Foundation Model이 등장하면서 상황이 완전히 달라졌다.

예를 들어 GPT를 생각해보자.
처음에는 인터넷의 텍스트를 엄청나게 학습해서 만들어진 모델인데,
그걸 조금만 다듬으면…

  • 질문 답변 봇
  • 작문 도우미
  • 코딩 어시스턴트
  • 요약기, 번역기
  • 심지어 의료 상담 챗봇까지!

GPT 하나로 이 모든 걸 가능하게 할 수 있다.
바로 이 점 때문에 GPT는 Foundation Model이라고 불린다.


4. 쉽게 말해서, Foundation Model은 ‘코인 육수’다

📦 예전에는?
— 떡국이면 떡국용 육수
— 만둣국이면 만둣국용 육수
— 잔치국수에는 국수용 육수...

국물 요리를 만들 때마다
매번 재료들을 손질하고, 국물을 끓이고, 간 맞추고...
국 하나 만드는 데 시간과 정성이 꽤나 많이 들어갔다.

🍞 요즘에는?
— Foundation Model이라는 아주 잘~ 만들어진 코인 육수가 있다.
— 사전에 재료들을 다듬고, 끓이고 하는 노력이 필요 없이, 이미 누군가가 고생하며 정성 들여 만들어놓은 그 육수를!

내가 만들 국그릇에 하나 넣고,
거기에 내가 원하는 재료를 넣어서
내 입맛에 맞게 간만 살짝 맞추면(fine-tuning) 그만이다.

즉, 미리 잘 만들어진 기초 모델을 다양한 용도에 맞게 조정(fine-tuning)해서 쓸 수 있다는 게 Foundation Model의 핵심이다.

Image created with AI · Curated by JINetic CODE

 


5. 이걸 로봇에도?

Foundation Model은 지금 텍스트, 이미지, 음성뿐 아니라
로봇 제어에도 확장되고 있다.

 

예를 들어:

  • 카메라로 주변을 보고 (Vision)
  • 사람의 말을 이해해서 (Language)
  • 실제로 로봇이 움직이게 만든다 (Action)

이걸 통합한 모델을 요즘 VLAM (Vision Language Action Model)이라고 부른다.
이건 ‘로봇을 위한 Foundation Model’이라고 볼 수 있다.


Summary

  • Foundation Model = 다양한 작업에 재활용 가능한 범용 AI 모델
  • 한 번 학습되면 다양한 응용 가능 (GPT가 대표적 예시)
  • 로봇, 의료, 법률 등 여러 분야에 확장 중

 

참고

https://blogs.nvidia.co.kr/blog/what-are-foundation-models/

 

파운데이션 모델이란 무엇인가? | NVIDIA Blog

1956년에 마일즈 데이비스 퀸텟(Miles Davis Quintet)은 프레스티지 레코드 사의 스튜디오에서 라이브 연주를 녹음하고 있었습니다.

blogs.nvidia.co.kr

 

'AI&ML' 카테고리의 다른 글

모델 평가 방법(Cross Validation + Bootstrap)  (0) 2025.04.09