본문 바로가기
의학 연구

[비전공자의 머신러닝 의학연구 #1] 머신러닝의 개요, 분류

by Dr CK 2026. 4. 28.

지금까지 의학연구는 통계가 근간이 되어왔다. 연구대상자를 모집하여 통계적 검정력을 확보하고, 카이제곱, 회귀분석 등을 통해서 p-value 0.05 이하의 유의성을 확인하며, 그때 회귀계수를 확인함으로써 연관성의 강도와 유의미함을 통계적으로 증명하였다.

시대가 발전함에 따라 이제는 통계적 검증만이 아니라 대규모 자료를 바탕으로한 머신러닝 학습이 발전하여 기존의 학습대상범위를 확장하였고, 더 정확한 알고리즘이 개발되며, 이를 통하여 인공지능 (AI) 의 시대가 도래하였다.

의학연구에 있어서도 이제 더 이상 통계적 검증 만이 해답이 아니고, 연구방법론의 확장을 꾀해야 하는 시기이다. 이 시리즈는 의학연구자로써 머신러닝을 연구에 도입하기 위하여 공부한 내용을 정리하고자 한다.

 

1. AI · 머신러닝 · 딥러닝 · 통계학의 관계

머신러닝 (Machine learning, ML)인공지능 (Artificial Intelligenct, AI) 의 한 분야로 데이터로부터 패턴을 학습하는 알고리즘을 뜻한다. AI은 가장 큰 개념으로 인간의 지능을 모방하는 모든 기술을 뜻하며, 딥러닝 (Deep Learning, DL)은 ML의 한 분야로 신경망을 사용하는 ML 이다. 딥러닝은 머신러닝의 한 분야로 하나의 알고리즘에 불과하지만 현대 인공지능의 발전에 있어 지대한 영향을 미쳐 다른 모델과 달리 하위카테로리로 따로 표시 한다.

 

머신러닝의 표준 정의는 Tom Mitchell이 1997년 Machine Learning 교과서에서 내린 것으로 "어떤 작업 T에 대하여 경험 E로부터 학습하여 성능 P를 향상시키는 컴퓨터 프로그램" 이라고 정의했다. 풀어쓰면 — 데이터(E)를 보고 → 어떤 작업(T)을 → 더 잘하게(P) 되는 프로그램 이라는 뜻이다.

 

전통적 통계와는 무엇이 다른가? 사실 ML과 통계학은 많은 부분 겹치며 선형 회귀, 로지스틱 회귀와 같은 모델은 정의상 머신러닝이다. 다만 강조점이 다르다. 통계학은 추론(inference)에 강조점을 두고(변수의 효과, p-value, 신뢰구간), 머신러닝은 예측(prediction)에 강조점을 둔다(예측 정확도, AUC, RMSE). 같은 도구를 다른 목적으로 쓰는 것이고, 같은 회귀 모델을 쓰더라도 두 분야에서 보고하는 내용이 다르다. 통계학에서는 HR과 p-value를, 머신러닝에서는 train/test split + AUC를 보고한다. 최근 의학 AI 논문은 두 분야를 통합하는 추세이다.

 

2. 머신러닝의 분류

머신러닝은 모델이 무엇을 보고 학습하느냐의 학습방법을 기준으로 지도학습, 비지도학습, 강화학습으로 분류할 수 있다.

2-1. 머신러닝 학습 방법 별 분류

머신러닝을 분류하는 가장 기본적인 분류방법이다.

지도학습 (Supervised Learning)

입력 X와 정답 y가 모두 주어진 데이터로 학습한다. 의학연구에서 가장 많이 쓰이는 형태이다. 우리가 익숙한 거의 모든 회귀와 분류 모델이 여기 속한다. 지도학습은 출력 형태에 따라 두 가지로 나뉜다.

  • 분류 (Classification) : y가 범주형 클래스 (예: 양성/음성, 0/1)
  • 회귀 (Regression) : y가 연속값 (예: 혈당, 혈압)

비지도학습 (Unsupervised Learning)

입력 X만 있고 정답 y가 없는 데이터에서 패턴을 찾는다.

  • 군집화 (Clustering) : 비슷한 샘플끼리 묶음. k-means, DBSCAN, 계층적 군집화
  • 차원 축소 : 변수 수를 줄여 시각화·압축. PCA, t-SNE, UMAP
  • 이상치 탐지 : 정상에서 벗어난 샘플 발견. Isolation Forest, One-class SVM
  • 연관 규칙 : 데이터 간의 관계 발견. Apriori, FP-Growth

강화학습 (Reinforcement Learning)

환경과 상호작용하며 보상을 최대화하는 행동을 학습한다. AlphaGo, 자율주행이 대표적이다. 강화학습은 데이터가 미리 주어지지 않고 학습 과정에서 만들어진다는 점에서 다른 두 패러다임과 본질적으로 다르다.

 

2-2. 알고리즘별 분류

ML 모델들을 알고리즘에 따라 나누면 다음과 같다. 이 분류는 학습 방법에 따른 분류와 다른 차원의 분류이다.

  • 선형 모델 (Linear models) : 선형 회귀, 로지스틱 회귀, Ridge, Lasso, GLM
  • 트리 기반 모델 (Tree-based) : Decision Tree, Random Forest, XGBoost, LightGBM, CatBoost
  • 거리·사례 기반 : k-NN
  • 커널 기반 : SVM
  • 신경망 (Neural networks) : MLP, CNN, RNN, Transformer 등 모든 딥러닝 모델.

 

3. 머신러닝 학습의 8단계 파이프라인

지도학습 모델을 학습시킨다고 할 때, 실제 작업은 어떤 순서로 이루어지는지 정리하면 다음과 같다.

  1. 문제 정의 : 무엇을 예측할 것인가? 평가지표는 무엇인가?
  2. 데이터 준비 : 결측치 처리, 인코딩, 스케일링 등 전처리. 실제로 시간의 80%를 차지한다.
  3. 데이터 분할 : Train / Validation / Test (보통 7:1.5:1.5 또는 8:2). 모델을 보기 전에 분할해야 한다 (data leakage 방지).
  4. 모델 선택 : 어떤 알고리즘을 쓸 것인가?
  5. 학습 : 모델이 데이터로부터 패턴을 학습. 손실함수를 최소화한다.
  6. 검증·튜닝 : Validation set으로 하이퍼파라미터를 조정한다.
  7. 최종 평가 : Test set은 마지막에 한 번만 사용한다.
  8. 배포·적용 : 외부 검증 코호트에 적용하거나, 실무에 응용한다.

이 흐름은 어떤 ML 모델을 쓰든 비슷하다. 결정트리든, 랜덤포레스트든, 딥러닝이든 8단계의 큰 흐름은 동일하다. 차이는 5단계(학습)의 내부에서 일어난다.

반응형