Application of Support Vector Machine in cancer diagnosis



Paper Information.

  • YEAR : 2010
  • AUTHOR : Hui Wang 외 1명
  • JOURNAL : Medical Oncology / SCIE


Abstract

  본 연구에서는 암 진단을 위해 SVM 모델을 사용한 종양 마커 검출의 임상적 적용과 관련된 내용을 기술합니다. 대장암, 위암, 폐암에 대한 종양 표지 검사(TM) 결과 데이터를 수집하였습니다. 해당 데이터를 사용하여 최상의 커널 기능을 가진 SVM 모델을 만들고 교차 검증을 통해 검증하였습니다. SVM의 매개변수를 최적화하기 위해 그리드 탐색 및 교차 검증 방법을 사용하였습니다. 분류를 위해 병합 진단 테스트, 로지스틱 회귀 분석, 의사 결정 트리와 같은 분류기를 사용했습니다. 성능 평가를 위해 Sensitivity, Specialty, Youden Index[각주:1], Accuracy 지표를 사용하였습니다. Leave-one-out CV(LOOCV) 방법을 사용하여 테스트를 진행했습니다. 결과적으로 4개의 분류기의 정확도는 75.8, 76.6, 83.1, 96.0% 였고, 위암으로 분류된 4개의 분류기의 정확도는 45.7, 64.5, 63.7, 91.7% 였습니다. 폐암의 경우 71.9, 68.6, 75.2, 97.5%였습니다. 3개의 암 데이터에서 SVM이 모두 좋은 성능을 나타냈습니다. 


Method / Result

  중국 상하이에 위치한 'Rengi Hospital'에서 데이터를 확보하였습니다. 데이터는 2005년 1월부터 6월까지의 종양 표지 검사 데이터를 활용하였습니다. Fig. 1과 같이 대장암 데이터는 총 159명, 위암은 567명, 폐암은 214명의 데이터를 활용하여 진행하였습니다. SVM 모델은 LIBSVM 소프트웨어를 활용하여 제작했습니다. 모든 실험에서 3가지 종류의 커널 함수(선형, RBF, 시그모이드)를 사용하였습니다. 이후, 5-fold Cross Validation을 통해 테스트를 진행했습니다. 

  분석은 SPSS 16.0 Version을 사용하여 진행하였고, Kolmogorov-Sminov(K-S) 방법으로 종양 마커의 농도 분포를 테스트했습니다. 로지스틱 회귀 분석은 SPSS를 기반으로 테스트 되었습니다.

< Fig. 1. Distribution of Samples >



  3종류의 SVM 커널 함수의 성능을 비교하였습니다. 커널 기능을 가진 SVM은 6개의 데이터 세트로 테스트 되었고, 데이터 세트에서 RBF 커널 기반의 SVM 모델이 가장 성능이 높게 측정되었습니다. 
 

< Fig. 2. The Accuracy Comparison of SVM with Different Kernel function in six datasets >


  의사 결정 나무, 로지스틱 회귀 분석과 같은 분류기의 성능은 Fig. 3에 제시되어 있습니다. 모든 데이터 세트에서 SVM이 우수한 성능을 나타냈습니다.

< Fig. 3. Comparison of Classification Performance of the Classifiers >


Summary

  1. 암 진단을 위해 SVM 모델을 사용하였고, 데이터는 대장암, 위암, 폐암 환자 데이터를 사용하였습니다.

  2. SVM 모델에서 선형, RBF, 시그모이드 커널을 사용하였고, RBF 커널이 가장 좋은 성능을 나타냈습니다.

  3. 기존의 전형적인 분류 모델들과 비교하여 SVM이 가장 우수한 성능을 나타냈습니다. 


  1. Youden Index : ROC 커브의 각 점에서 기울기가 1인 직선을 그렸을 때 y절편이 가장 큰 값 [본문으로]

+ Recent posts