병리 슬라이드를 이용한 종양 탐지 AI 모델 개발

Changseok
tesser-team
Published in
9 min readNov 29, 2023

--

안녕하세요, 테서 연구개발팀의 이창석입니다.

저희 팀은 인공지능을 활용하여 유방 병리조직에서 순도 높은 종양 영역을 검출하고 실제 임상 환경에서 성능을 검증하는 프로젝트를 진행했습니다.

본 프로젝트에서는 딥러닝을 포함한 인공지능 기술을 활용하여 병리 조직 슬라이드 내의 종양 영역을 보다 정확하게 식별하는 것을 목표로 삼았습니다.

병리 조직 슬라이드는 염색 과정의 차이, 스캐너의 종류 및 설정 등으로 인해 데이터에 큰 편차가 있습니다. 이러한 다양한 조건에서도 일관된 성능을 보이는 인공지능 모델을 개발하는 것이 중요한 과제였습니다.

저희의 목표는 이러한 모델을 통해 임상 현장에서 병리학자가 보다 신속하고 정확한 진단을 내릴 수 있도록 보조하는 것입니다. 이 과정은 의료 AI 기술의 발전은 물론, 환자 진단 및 치료에도 중요한 기여를 할 것으로 기대하고 있습니다.

이를 위해, 임상 현장에서 병리학자가 인공지능 모델을 쉽게 사용할 수 있도록 사용자 친화적인 그래픽 사용자 인터페이스(GUI) 프로그램을 개발했습니다. 이 GUI 프로그램은 병리학자가 복잡하지 않고 직관적으로 데이터를 분석하고 결과를 해석할 수 있도록 설계하였으며, 병리학적 분석의 정확성과 효율성을 높이고, 진단 과정을 간소화하는 데 기여하고자 합니다.

본 글은 저희 팀의 연구 진행 과정, 도전 과제, 그리고 이를 해결하기 위한 접근 방법에 대해 서술하고자 합니다.

연구 배경

국내 여성 유방암의 연도별 발생 추이 (출처: 중앙암등록본부 2021)

유방암은 전 세계적으로 여성에게 가장 흔한 암 중 하나이며, 조기 진단과 효과적인 치료 방법의 개발이 매우 중요합니다. 이러한 맥락에서 병리학적 분석은 유방암 진단과 치료 과정에서 중추적인 역할을 합니다. 주로 병리 조직 슬라이드를 통해 이루어지는 이 분석은 종양의 성질과 단계를 평가하는 데 필수입니다.

최근 몇 년간 인공지능, 특히 딥러닝 기술은 의료 영상 분석 분야에서 중요한 발전을 이루었습니다. 이러한 기술은 병리 조직 슬라이드에서 암세포를 검출하고 분석하는 데 큰 기여를 하였습니다. 병리학자의 작업을 보조하여 정확하고 신속한 진단을 가능하게 하는 데 중요한 역할을 했습니다.

그러나 본 프로젝트에서 마주한 주요 도전 과제는 병리 조직 슬라이드 데이터의 다양성이었습니다. 다양한 염색 방법, 농도, 스캐너의 종류 및 설정은 데이터의 특성을 달리하게 만들었습니다. 이러한 데이터 다양성은 인공지능 모델이 일관된 정확도를 유지하는 데 어려움을 초래했습니다. 이에 대응하여, 저희 팀은 이러한 다양성을 고려하여 강건한 모델을 설계하고 최적화하는 데 집중했습니다.

위 배경을 바탕으로, 저희 팀은 유방 병리조직에서 순도 높은 종양 영역을 정확하게 검출하는 인공지능 모델을 목표 삼아 프로젝트를 진행했습니다.

연구 목적

유방 병리 조직 슬라이드가 무엇인가요?

유방 병리 조직 슬라이드

유방 병리 조직 슬라이드 데이터는 유방암 진단을 위해 병리학적으로 검사하는 조직 샘플입니다. 이 샘플은 미세하게 절단되어 유리 슬라이드에 놓이며, 염색 과정을 통해 암세포와 정상 세포를 구분할 수 있게 합니다.

병리 슬라이드의 피라미드 구조 (출처: SurfaceSlide: A Multitouch Digital Pathology Platform)

조직 슬라이드는 디지털 이미지로 변환되며, 여기서 데이터의 특징이 드러납니다. 디지털 슬라이드는 다양한 확대 레벨을 포함하는 피라미드 구조를 가지고 있어, 높은 해상도의 전체 이미지부터 더 작은 영역에 대한 상세한 분석까지 가능합니다. 이 데이터는 유방암의 종류, 크기, 성장 패턴 등을 파악하는 데 사용 되어, 정확한 진단과 치료 계획을 수립하는 데 중요한 역할을 합니다.

유방 병리 조직 슬라이드에서 얻을 수 있는 정보는 무엇인가요?

유방 병리 조직 슬라이드에서 얻을 수 있는 정보는 매우 광범위합니다. 이 데이터는 우선적으로 유방암의 존재 여부를 확인하고, 암의 유형을 식별하는 데 사용됩니다.

저희는 유방 조직 병리 슬라이드에서 종양 영역을 정확하게 분할하기 위해 다음 과정들을 중심으로 프로젝트를 진행했습니다.

인공지능 기반 종양 탐지 모델 및 GUI 프로그램 개발

유방 조직 병리 슬라이드에서 종양 영역을 정확하게 분할하고 분석하기 위한 인공지능 모델과 사용자 친화적인 GUI 프로그램 개발에 초점을 맞췄으며 유방암의 존재와 유형을 식별하는 데 필수적인 데이터 처리와 학습 방법을 채택했습니다.

개발된 GUI 프로그램은 병리학자가 분석 결과를 쉽게 이해하고 활용할 수 있도록 설계되었습니다. 이를 통해 다량의 병리 슬라이드의 종양 영역을 빠른 시간 내에 확인 가능하며, 검체 분석 시 걸리는 소요 시간을 획기적으로 단축할 수 있었습니다.

또한 인공지능에서 도출된 영역을 GUI 상에서 보여주므로써, 일관된 결과를 받아볼 수 있습니다. 이는 분석 결과에 대한 신뢰도와 재현성을 높이는 이점이 있습니다.

연구 진행

유방암의 종류

유방 조직 병리 슬라이드에서 확인할 수 있는 유방암의 종류는 다양합니다. 주요 유형으로는 IDC(침윤성 유관암), DCIS(비침윤성 유관암), ILC(침윤성 소엽암), LCIS(비침윤성 소엽암) 등이 포함됩니다.

본 프로젝트에서는 이러한 여러 유형의 유방암을 하나의 클래스로 합쳐서, 초기 단계에서 넓은 범위의 종양 영역을 식별하는 인공지능 모델을 개발하는 것에 중점을 두었습니다.

데이터셋 생성 프로세스

병리 슬라이드를 이용한 비종양/종양 패치 데이터 생성 프로세스

학습을 위한 데이터 생성 과정은 아래와 같이 진행했습니다.

  1. 병리 슬라이드에서 종양 영역을 수동으로 라벨링
  2. 세포, 정상 조직, 종양 영역의 이진 마스크를 생성
  3. 학습을 위한 비종양/종양 패치를 구분하여 데이터 생성

위 과정은 여러 실험을 거쳐 최적화하였으며, 이는 모델 학습의 정확도와 효율성을 높이는 데 중요한 역할을 했습니다.

인공지능 모델 학습

유방암 병리 슬라이드의 종양 학습 파이프라인

AI 모델 학습 및 최적화는 아래와 같은 과정으로 진행했습니다.

  1. 비종양 패치가 대부분을 차지하는 클래스 불균형 문제를 해결하기 위해 종양/비종양 패치 비율을 조절하여 종양 검출에 효율적인 모델 학습 진행
  2. SOTA 모델을 이용하여 병리 슬라이드 내 종양을 탐지하는 패치 기반 딥러닝 모델 개발
  3. 5-fold 교차 검증을 통해 5개의 모델 테스트를 진행하여 더욱 일반화된 모델 생성
  4. 하이퍼 파라미터 튜닝 과정을 통해 모델 최적화 진행 및 과적합 방지

뿐만 아니라, 위 과정 내 Sliding window 추론 및 Small Area Filter 알고리즘을 적용하여 순도 높은 종양 영역을 정확하게 검출하는 인공지능 모델을 개발했습니다.

GUI 프로그램 개발

온프레미스 도식도

윈도우 기반의 사용자 친화적인 그래픽 사용자 인터페이스(GUI) 프로그램을 개발하여 병리학자가 임상 현장의 PC에서 쉽게 접근하고 사내 서버 사용할 수 있게 하여 편리성과 보안적인 측면도 고려하여 프로젝트를 진행하였습니다.

이 프로그램은 다양한 기능을 갖추고 있어, 사용자는 종양 영역과 인공지능 모델이 제공하는 결과를 효과적으로 확인하고 분석할 수 있습니다.

연구 결과

패치 기반 종양 탐지 인공지능 모델 결과

5-fold 교차 검증 모델 학습 결과
외부(External) 데이터셋에서 평균 F1 Score 0.9513 달성

저희는 모델의 일반화 성능을 향상시키기 위해 5-fold 교차 검증 방법을 사용했습니다. 이 접근법을 통해, 데이터셋을 5-fold로 나누어, 동일한 모델 구조에 대해 다섯 번의 학습 및 검증을 진행했습니다.

학습한 모델은 외부(External) 데이터셋을 이용하여 평가한 결과, 각각의 폴드에서 인상적인 정확도를 달성했으며 그 결과는 다음과 같습니다.

  • Fold 0: 0.9532
  • Fold 1: 0.9518
  • Fold 2: 0.9513
  • Fold 3: 0.9506
  • Fold 4: 0.9498

이러한 결과들을 바탕으로, 이 다섯 모델의 평균 F1 점수는 0.95 이상을 달성했습니다. 이는 모델이 높은 수준의 성능과 일관성을 가지고 있음을 보여줍니다.

6개의 시험 예제 케이스

GUI 프로그램

GUI 프로그램 실행 사진

임상 환경에서 사용할 수 있는 병리 슬라이드 내 종양 검출 GUI 소프트웨어는 사진과 같이 개발이 되었으며, 종양 분석 결과를 빠르고 효과적으로 확인할 수 있도록 설계되었습니다.

결과 레포트(왼쪽) 및 데이터 시트(오른쪽)

사용자는 Tumor Confidence 조절 기능을 사용하여 원하는 종양 신뢰도 수준을 선택할 수 있습니다:

  • ‘Soft’는 종양 영역의 50% 이상을 표시합니다.
  • ‘Moderate’는 70% 이상의 종양 영역을 표시합니다.
  • ‘Hard’는 90% 이상의 종양 영역만을 표시합니다.

더불어, 사용자는 종양 추론 결과를 바탕으로 상세분석 리포트(Report)와 데이터 시트를 생성하는 기능을 이용할 수 있습니다, 이를 통해 진단 정보를 체계적으로 문서화하고 필요 시 즉시 공유가 가능합니다.

마치며

본 프로젝트를 통해, 저희 팀은 유방암 진단의 정확성과 효율성을 높이기 위한 인공지능 모델과 GUI 프로그램을 개발하였습니다. 이러한 기술은 의료 현장의 전문가들이 보다 빠르고 정확한 진단을 내리는 데 큰 도움이 될 것입니다.

높은 비용의 고해상도 현미경이 없더라도 다양한 임상 환경에서 빠르게 병리 슬라이드를 분석할 수 있다면, 병리검사의 효율을 높일 뿐 아니라, 정량적 측정을 통해 대규모의 데이터를 지속적으로 구축할 수 있도록 하는 효과가 있습니다.

이러한 데이터는 다양한 다른 의료 데이터들(혈액 검사, 유전자 검사, 비정형 텍스트 추출 정보, CT/MRI 정량 분석 정보 등)과 결합되어 통합적인 모델링을 보다 광범위한 데이터셋에서 시도할 수 있습니다. 이를 통해 정확한 예후 예측과 함께 치료 결정에 있어서 보다 개인화된 치료계획(personalized medicine)과 정밀의학(precision medicine)적 접근에 한걸음 더 다가갈 수 있습니다.

인공지능 기술이 의료 분야에 가져올 변화는 매우 크고 앞으로의 잠재력도 무한합니다. 의료 AI의 미래를 형성하는 데 있어 테서 연구개발팀과 모든 팀원이 함께 성장하고 발전해 나가는 모습이 기대됩니다.

--

--