A principled machine learning framework improves accuracy of
stage II colorectal cancer prognosis 


Paper Information.

  • YEAR : 2018
  • AUTHOR : Neofytos Dimitriou 외 3명
  • JOURNAL : Nature (Digital Medicine)



Abstract

  정확한 예후는 암 환자를 위한 적절한 치료 계획을 세우기 위한 기본 요소입니다. 질병의 이질성, 병리학자 간의 다양성, 현재 병리학적 보고 시스템의 고질적인 한계로 인하여 환자 결과는 유사하게 발병된 환자 코호트 내에서 상당히 다양합니다. 이는 TNM 가이드 라인을 사용하여 2기 직결장암 환자를 분류할 때 특히 부각됩니다. 본 연구의 목적은 기계 학습을 활용하여 이러한 문제를 해결하는 것입니다. 특히, 우리는 면역 형광 이미지에서 쉽게 수집 된 다양한 유형의 특징들을 사용하는 데이터 기반 프레임워크를 도입하였습니다. 본 연구에서 개발한 모델은 173명의 직결장암 2기 환자의 사망률을 예측하는 데 탁월한 성능을 자랑합니다. 이는 기존의 임상 지침의 성능을 능가합니다.



Result

1. Full Feature set based Analysis

  각 기준 분류기의 하이퍼파라미터 값은 검증된 데이터 자료에 대해 AUROC 평균 영역을 최대화하여 학습되었습니다. Fig. 1은 결과를 요약한 것입니다. 

< Fig. 1. Average AUROC and SD of trained classifiers on the training set using 20-times repeated tenfold CV >


모든 분류기에 걸친 평균 AUROC는 5년 및 10년 예후 모두 0.89인 것으로 나타났습니다. ANOVA(One-way analysis of variance)와 THSD(Tukey's Honest Significance Difference Test)는 10년 예후에 대한 분류기들 사이에서 통계적 유의성을 나타내지 않았습니다. 통계적으로 유의한 차이는 5년 예후에 대한 나이브 베이즈(NB)와 로지스틱 회귀(LR) 기반 접근법 사이에서 발견되었습니다. 모델 선택의 중요성을 입증하기 위해 우리는 이전 섹션에서 설명한대로 학습된 하이퍼파라미터 값과 기존 문헌에서와 같이 사전 설정된 하이퍼파라미터 값을 사용하여 모든 분류기들의 성능을 비교하였습니다. 예상대로, 후자의 접근법을 사용했을 때 평균 AUROC의 감소는 각각 0.82, 0.85로 5년 및 10년 예후 모두 감소하는 것을 확인할 수 있었습니다.


2. Feature Selection

  특징의 각 하위 집합에 대한 평가는 학습 데이터에 대한 10-fold CV를 통해 수행되었습니다. 확률론적 효과로 인한 결과의 변동성을 줄이기 위해서 Dune이 제안한 방법을 적용하였습니다. 특히, 최고의 성능을 달성한 특징 서브 세트를 유지할 때마다 서로 다른 무작위 파티션을 사용하여 SFFS 및 SFBS를 40번 수행하였습니다. 이후, 발생 빈도에 기초하여 특징들을 순서화 했습니다. 빈 세트로 시작해 특징들은 평균 AUROC 순서위에 따라 추가되었으며 20회 반복된 10-fold CV를 통해 검증되었습니다. 가장 높은 평균 AUROC를 달성한 특징들의 서브 세트는 각각의 예후적 용어에 대해 선택되었습니다.

< Fig. 2. Frequency of occurrence of each feature form the 20 runs of SFFS an SFBS each for 5-year prognosis >


< Fig. 3. Frequency of occurrence of each feature from the 20 runs of SFFS and SFBS each for 10-year prognosis >


3. Experiment

  이전 섹션과 같이 분류기를 훈련시키고, 모델 선택 및 평가에 대한 동일한 접근을 수행하였습니다. 유일한 차이점은 전체 특징 세트 대신에 축소된 특징 세트가 사용된다는 것입니다. 예상대로, 가장 조밀한 수준의 분석에서 이미 상당한 성능 향상을 보였으며, 5년 및 10년 예후 모두에 대해 분류자의 평균 AUROC는 0.94에 달했습니다. 이전 연구 결과와 비교하여 10년 예후에 대한 Random Forest에서의 열등함을 제외하고는 다른 분류기에서 통계적으로 유의한 차이가 발견되지 않았습니다.

4. Final Testing

  20번 반복된 10-fold CV를 사용하여 여러 분류자의 훈련 세트 성능을 검사했습니다. SFFS와 SFBS에 의해 선택된 특징의 하위 집합에 대해 훈련된 분류기가 더 잘 분류하는 것을 확인할 수 있었습니다. 5년 및 10년 예후에서 단순하지만 최고의 성능을 발휘하는 분류기는 k-NN 기반 분류기였습니다. 예측된 예후 그룹 사이의 생존률 차이를 객관화하기 위해 Kaplan-Meier 생존 곡선을 사용하였습니다. 5년 예후에서 k-NN 기반 분류기는 AUROC 0.77을 다성하여 환자를 고위험군과 저위험군으로 분류하는데 효과적이였습니다. 10년 예후에서, 분류기는 AUROC 0.94를 달성하여 임상 표준인 0.65를 훨씬 능가하며, 10년 예후에 대해서도 88.9%의 정확도를 보였습니다.



Summary

  1. 본 연구에서는 TNM 가이드라인을 활용하여 2기 직결장암 환자를 분류하는 모델을 구축하였습니다.

  2. Feature Selection에서 차원 축소를 위해 SFFS, SFBS를 사용하여 특징의 수를 감소시켰습니다.

  3. 모델은 LSVM, RSVM, LR, RF, KNN, NB을 사용하여 각 모델의 성능을 비교하였습니다.

  4. 5년 및 10년 예후 예측에서 KNN 모델이 가장 우수한 성능을 보였습니다.

  5. 생존률 차이를 분석하기 위한 Kaplan-Meier 분석 방법에서도 AUROC 값이 임상 표준인 0.65보다 약 0.29 높은 0.94를 달성하였습니다.


+ Recent posts