基于多器官代謝組學(xué)和集成學(xué)習(xí)的死亡時(shí)間推斷方法
死亡時(shí)間推斷是推測(cè)和判斷尸體檢驗(yàn)時(shí)距離死亡當(dāng)時(shí)的間隔時(shí)間,一直以來都是法醫(yī)實(shí)際工作的難點(diǎn),同樣也是法醫(yī)病理學(xué)研究的科學(xué)問題。準(zhǔn)確推斷死亡時(shí)間對(duì)明確發(fā)案時(shí)間、劃定作案嫌疑人、確定案件性質(zhì)乃至整個(gè)案件偵破均具有重要作用。在實(shí)際檢案工作中,法醫(yī)最常用的方法是依據(jù)尸體現(xiàn)象如尸斑、尸僵、胃腸內(nèi)容物消化程度、昆蟲、微生物等推斷死亡時(shí)間,但這些方法往往受勘驗(yàn)者的主觀經(jīng)驗(yàn)、死者自身因素(性別、年齡、體重、衣著情況、死亡原因等)、周圍環(huán)境(溫度、濕度、空氣流通等)等錯(cuò)綜復(fù)雜的因素影響,死亡時(shí)間的推斷常常出現(xiàn)較大誤差。
因此,探索一種更為便捷、準(zhǔn)確的方法尤為迫切。代謝組學(xué)技術(shù)主要研究對(duì)象為參與新陳代謝、維持生命體正常生長、發(fā)育、凋亡的所有內(nèi)源性小分子,如氨基酸、碳水化合物、脂類、核酸等,通過應(yīng)用超高效液相色譜-高分辨率質(zhì)譜聯(lián)用技術(shù)檢測(cè)大鼠死后0d-30d內(nèi)骨骼肌、肝臟、肺臟、腎臟中的小分子化合物,利用差異性小分子化合物結(jié)合集成學(xué)習(xí)算法建立多器官組織多指標(biāo)多模型的死亡時(shí)間推斷判別模型,為死亡時(shí)間推斷提供新的方法和思路。實(shí)驗(yàn)及分析流程如圖1。
通過OPLS-DA分析,依據(jù)VIP>1和獨(dú)立樣本t檢驗(yàn)P<0.05篩選出大鼠骨骼肌所有時(shí)間點(diǎn)共有42個(gè)差異性小分子
圖1 實(shí)驗(yàn)及分析流程
化合物,大鼠肝臟共有59個(gè)差異性小分子化合物,大鼠肺臟共有62個(gè)差異性小分子化合物,大鼠腎臟共有67個(gè)差異性小分子化合物。這些小分子化合物主要包括氨基酸、脂肪酸、核苷酸、酰胺、醛類、酮類、有機(jī)酸、吲哚衍生物和其他生物活性物質(zhì)。四種器官組織共有的內(nèi)源性差異小分子化合物有13個(gè),以上化合物分別在四種器官組織中的相對(duì)表達(dá)量變化如圖2。
利用各器官組織篩選出的差異性小分子化合物分別建立了單一器官組織的死亡時(shí)間推斷模型,將測(cè)試集數(shù)據(jù)帶入各模型中,骨骼肌、肝臟、肺臟、腎臟的預(yù)測(cè)準(zhǔn)確率分別為61%、53%、53%、69%,如圖3所示。
將4種器官組織共計(jì)共計(jì)230個(gè)差異性小分子化合物融合,建立多器官組織多指標(biāo)機(jī)器學(xué)習(xí)模型,將測(cè)試集帶入模型進(jìn)行性能測(cè)試,模型的最小平均AUCs為0.94,除7d、15d和21d的AUCs小于0.9,其他各時(shí)間點(diǎn)均大于0.9,最終的
圖2 不同死亡時(shí)間點(diǎn)4種器官組織共有化合物的相對(duì)表達(dá)量變化趨勢(shì)
圖3 四種器官組織最優(yōu)模型RF的測(cè)試結(jié)果
預(yù)測(cè)準(zhǔn)確率為78%,如圖4所示。
圖4 多器官組織多指標(biāo)融合RF模型測(cè)試結(jié)果
依據(jù)骨骼肌、肝臟、腎臟、肺臟所有時(shí)間點(diǎn)差異性小分子化合物,對(duì)各器官組織分別進(jìn)行RF、SVM、MLP三種機(jī)器學(xué)習(xí)模型的建立,通過比較驗(yàn)證集ROC曲線及AUCs,確定各器官組織最優(yōu)模型。將各器官組織的最優(yōu)模型進(jìn)行多器官組織多指標(biāo)多模型的Stacking集成學(xué)習(xí),集成學(xué)習(xí)模型流程圖如圖5所示。將測(cè)試集數(shù)據(jù)代入集成學(xué)習(xí)模型中,最小平均AUCs=0.95,且具體時(shí)間點(diǎn)0d、1d、2d、3d、5d、15d、18d、24d、27d和30d的AUCs為1.00,集成學(xué)習(xí)模型的準(zhǔn)確率高達(dá)78%,遠(yuǎn)高于單一器官組織模型。與第三部分實(shí)驗(yàn)結(jié)果相比,雖多器官組織指標(biāo)融合的RF模型預(yù)測(cè)準(zhǔn)確率也為78%,但本部分中集成學(xué)習(xí)模型的AUCs更高(0.95vs0.91),且14個(gè)死后時(shí)間點(diǎn)中的10個(gè)時(shí)間點(diǎn)的模型AUCs=1.0。這也就說明了集成學(xué)習(xí)模型的優(yōu)越性,可用于PMI推斷的研究,達(dá)到了本研究的預(yù)期目的。
圖5 Stacking集成學(xué)習(xí)流程圖
此部分內(nèi)容已于2022年6月3日發(fā)表在《International Journal of Legal Medicine上》。