
Survival Analysis and Prognosis of Lung Cancer Patients Using NHISS

Su Hoon Choi, Jeong Hwa Yang,Min Soo Kim

Journal of the Korean Data Analysis Society(2021)

引用 0|浏览0
폐암은 5년 이상 생존하는 환자가 10∼15%에 불과한 예후가 좋지 않은 대표적인 병이며 환자 개개인의 특성에 따라 예후가 상이한 모습을 보이므로 예후에 대한 정확한 정보 제공이 중요하다. 본 연구에서는 국민건강보험자료 공유서비스(NHISS)에서 제공하는 의료 데이터를 통해 2012년부터 2018년까지의 진료 기록이 존재하는 폐암 환자 총 100,268명에 대하여 생존분석과 예후 예측을 실시하고자 한다. 콕스 비례위험 모형, 카플란 마이어 생존 곡선, 로그순위 검정을 통해 폐암 환자의 생존분석을 실시하였으며, 콕스 비례위험 모형으로 예후에 영향을 미치는 요인들을 살펴보고 카플란 마이어 생존 곡선으로 성별과 흡연여부에 따른 예후를 비교해보았다. 또한 개별 환자들의 잔여수명을 예측하여 실제수명과의 차이를 확인하였다. 평균절대오차(MAE)와 평균 제곱근오차(RMSE)를 계산한 결과 각각 575일, 658일의 차이를 보였으며 향후 더 정확한 예측을 위한 방안이 필요할 것으로 보인다. 환자에 대한 생존 분석을 통해 생존기간에 영향을 미치는 요소들을 발견하고 이를 토대로 환자들의 예후를 개선할 수 있는 방안 마련이 기대된다.Lung cancer is a representative disease with poor prognosis, with only 10∼15% of patients surviving for more than five years and it is important to provide accurate information on prognosis because the prognosis varies depending on the characteristics of each patient. Through medical data provided by NHISS this study aims to conduct survival analysis, prognosis prediction for a total of 100,268 lung cancer patients with medical records from 2012 to 2018. Survival analysis of lung cancer patients was conducted through Cox proportional hazard model, Kaplan-Meier curve, and Log-rank test. According to the analysis, the factors that affect the prognosis through the risk ratio of variables with the Cox proportional hazard model were examined and the prognosis according to gender and smoking were compared with the Kaplan-Meier curve. In addition, the residual life of individual patients was predicted and compared to the actual life. Calculating the MAE and RMSE showed a difference of 575 days and 658 days respectively, and it seems that a plan for more accurate predictions will be needed in the future. We hope to find factors that affect the survival period through survival analysis of patients and come up with ways to improve patients’ prognosis based on them.
AI 理解论文
Chat Paper