基于多器官代謝組學和集成學習的死亡時間推斷方法
死亡時間推斷是推測和判斷尸體檢驗時距離死亡當時的間隔時間,一直以來都是法醫(yī)實際工作的難點,同樣也是法醫(yī)病理學研究的科學問題。準確推斷死亡時間對明確發(fā)案時間、劃定作案嫌疑人、確定案件性質乃至整個案件偵破均具有重要作用。在實際檢案工作中,法醫(yī)最常用的方法是依據尸體現象如尸斑、尸僵、胃腸內容物消化程度、昆蟲、微生物等推斷死亡時間,但這些方法往往受勘驗者的主觀經驗、死者自身因素(性別、年齡、體重、衣著情況、死亡原因等)、周圍環(huán)境(溫度、濕度、空氣流通等)等錯綜復雜的因素影響,死亡時間的推斷常常出現較大誤差。
因此,探索一種更為便捷、準確的方法尤為迫切。代謝組學技術主要研究對象為參與新陳代謝、維持生命體正常生長、發(fā)育、凋亡的所有內源性小分子,如氨基酸、碳水化合物、脂類、核酸等,通過應用超高效液相色譜-高分辨率質譜聯用技術檢測大鼠死后0d-30d內骨骼肌、肝臟、肺臟、腎臟中的小分子化合物,利用差異性小分子化合物結合集成學習算法建立多器官組織多指標多模型的死亡時間推斷判別模型,為死亡時間推斷提供新的方法和思路。實驗及分析流程如圖1。
通過OPLS-DA分析,依據VIP>1和獨立樣本t檢驗P<0.05篩選出大鼠骨骼肌所有時間點共有42個差異性小分子
圖1 實驗及分析流程
化合物,大鼠肝臟共有59個差異性小分子化合物,大鼠肺臟共有62個差異性小分子化合物,大鼠腎臟共有67個差異性小分子化合物。這些小分子化合物主要包括氨基酸、脂肪酸、核苷酸、酰胺、醛類、酮類、有機酸、吲哚衍生物和其他生物活性物質。四種器官組織共有的內源性差異小分子化合物有13個,以上化合物分別在四種器官組織中的相對表達量變化如圖2。
利用各器官組織篩選出的差異性小分子化合物分別建立了單一器官組織的死亡時間推斷模型,將測試集數據帶入各模型中,骨骼肌、肝臟、肺臟、腎臟的預測準確率分別為61%、53%、53%、69%,如圖3所示。
將4種器官組織共計共計230個差異性小分子化合物融合,建立多器官組織多指標機器學習模型,將測試集帶入模型進行性能測試,模型的最小平均AUCs為0.94,除7d、15d和21d的AUCs小于0.9,其他各時間點均大于0.9,最終的
圖2 不同死亡時間點4種器官組織共有化合物的相對表達量變化趨勢
圖3 四種器官組織最優(yōu)模型RF的測試結果
預測準確率為78%,如圖4所示。
圖4 多器官組織多指標融合RF模型測試結果
依據骨骼肌、肝臟、腎臟、肺臟所有時間點差異性小分子化合物,對各器官組織分別進行RF、SVM、MLP三種機器學習模型的建立,通過比較驗證集ROC曲線及AUCs,確定各器官組織最優(yōu)模型。將各器官組織的最優(yōu)模型進行多器官組織多指標多模型的Stacking集成學習,集成學習模型流程圖如圖5所示。將測試集數據代入集成學習模型中,最小平均AUCs=0.95,且具體時間點0d、1d、2d、3d、5d、15d、18d、24d、27d和30d的AUCs為1.00,集成學習模型的準確率高達78%,遠高于單一器官組織模型。與第三部分實驗結果相比,雖多器官組織指標融合的RF模型預測準確率也為78%,但本部分中集成學習模型的AUCs更高(0.95vs0.91),且14個死后時間點中的10個時間點的模型AUCs=1.0。這也就說明了集成學習模型的優(yōu)越性,可用于PMI推斷的研究,達到了本研究的預期目的。
圖5 Stacking集成學習流程圖
此部分內容已于2022年6月3日發(fā)表在《International Journal of Legal Medicine上》。