公共衛(wèi)生學(xué)院張巖波教授課題組關(guān)于冠心病心力衰竭患者3年全因死亡率的可解釋性預(yù)測研究最新成果
2021年9月,在國際學(xué)術(shù)期刊Computers in Biology and Medicine上以“Interpretable prediction of 3-year all-cause mortality in patients with heart failure caused by coronary heart disease based on machine learning and SHAP”為題在線發(fā)表了山西醫(yī)科大學(xué)公共衛(wèi)生學(xué)院張巖波教授團(tuán)隊(duì)的研究論文。
在本研究中,作者開發(fā)并測試了一種可解釋的基于機(jī)器學(xué)習(xí)(machine learning,ML)的風(fēng)險分層工具,以預(yù)測冠心病引起的心衰患者在3年隨訪期間的全因死亡率。在6種ML分類器中,XGBoost的性能最好,因此,作者使用該模型來創(chuàng)建ML風(fēng)險評分。研究發(fā)現(xiàn)該風(fēng)險評分模型明顯優(yōu)于目前可用的其他風(fēng)險評分。最終結(jié)果表明,ML具有臨床應(yīng)用的潛力,以改善風(fēng)險評估。同時,作者利用SHAP值和SHAP圖證明了ML方法可以說明冠心病心衰患者的關(guān)鍵特征,建立高精度的死亡率預(yù)測模型。特征重要性的說明和特征重要性的可視化解釋可以讓醫(yī)生直觀地理解XGBoost中的關(guān)鍵特征,幫助醫(yī)生更好地理解模型的決策過程,結(jié)果中描述的詳細(xì)信息和對于風(fēng)險因素的解釋讓醫(yī)生更有洞察力,可以幫助他們做出更明智的決定,而不是一味盲目地相信算法的結(jié)果。
山西醫(yī)科大學(xué)公共衛(wèi)生學(xué)院2018級博士研究生王可為文章第一作者,山西醫(yī)科大學(xué)公共衛(wèi)生學(xué)院張巖波教授和山大一院韓清華教授為共同通訊作者。該工作得到國家自然科學(xué)基金、重大疾病風(fēng)險評估山西省重點(diǎn)實(shí)驗(yàn)室等多方資助。
A
|
B
|
Figure1Categorization threshold of Prediction score(A)andKaplan–Meier estimator for populationwith low and high machine learning risk (B).
Figure2Multivariable Cox regression for3-yearall-cause death prediction.
Figure3Variable importance in ML classification for men (A,N= 1023) and women (B,N= 539). Kaplan–Meier curves for subjects with highand low ML risk in mam (C) and woman (D).
No-survivor
|
Survivor
|
Figure4The interpretation of model prediction results with the two samples. (The values of each variable are normalized values.)