近日,我校公共衛(wèi)生學(xué)院曹紅艷副教授團(tuán)隊(duì)依托煤炭環(huán)境致病與防治教育部重點(diǎn)實(shí)驗(yàn)室、重大疾病風(fēng)險(xiǎn)評(píng)估山西省重點(diǎn)實(shí)驗(yàn)室,在中國(guó)科學(xué)院1區(qū)TOP期刊British Journal of Cancer(IF 8.8)上發(fā)表論文“wMKL: multi-omics data integration enables novel cancer subtype identification via weight-boosted multi-kernel learning”,曹紅艷副教授為第一作者,密歇根州立大學(xué)統(tǒng)計(jì)概率系崔躍華教授為通訊作者。
腫瘤分子異質(zhì)性是傳統(tǒng)腫瘤病理學(xué)不能準(zhǔn)確分型的重要原因,多組學(xué)數(shù)據(jù)整合分子分型可為腫瘤分類分級(jí)和靶向治療提供重要科學(xué)依據(jù)。多組學(xué)數(shù)據(jù)存在高噪聲、數(shù)據(jù)冗余的特點(diǎn),高噪聲一定程度上稀釋了原本很弱的分子特征信號(hào),現(xiàn)有整合分型方法對(duì)分子特征信號(hào)的捕獲上存在不足。本研究聯(lián)合多種先驗(yàn)特征信號(hào),提出了加權(quán)多核學(xué)習(xí)多組學(xué)數(shù)據(jù)整合方法(weight-boosted Multi-Kernel Learning,wMKL),其分型準(zhǔn)確性優(yōu)于現(xiàn)有加權(quán)方法以及未加權(quán)方法。進(jìn)一步將wMKL應(yīng)用于乳頭狀腎細(xì)胞癌和肺腺癌多組學(xué)數(shù)據(jù)整合分子分型,識(shí)別出了具有顯著生存差異的分子亞型,不同亞型在腫瘤相關(guān)生物通路活性以及免疫細(xì)胞浸潤(rùn)水平等方面皆存在顯著差異。wMKL方法的提出為多組學(xué)數(shù)據(jù)整合的腫瘤分子分型研究提供了新思路,同時(shí),該方法亦能適用于其他異質(zhì)性疾病的分子分型。wMKL的R軟件包發(fā)布在github網(wǎng)站(https://github.com/biostatcao/wMKL)。
曹紅艷副教授團(tuán)隊(duì)多年開(kāi)展多組學(xué)數(shù)據(jù)整合分子分型方法及其應(yīng)用研究,發(fā)展了系列多組學(xué)數(shù)據(jù)整合分子分型方法,如分層多核學(xué)習(xí)(hierarchical multi-kernel learning, hMKL,Briefings in Bioinformatics, 2023)、基于共性結(jié)構(gòu)的相似網(wǎng)絡(luò)融合(joint similarity network fusion, Joint-SNF, Computational and Structural Biotechnology Journal, 2022)、網(wǎng)絡(luò)增強(qiáng)核融合(Network Enhancement Fusion, ne-SNF, Computational and Structural Biotechnology Journal, 2021)等方法,為多組學(xué)數(shù)據(jù)整合分析提供了研究工具和新的分析方法。團(tuán)隊(duì)所在學(xué)科流行病與衛(wèi)生統(tǒng)計(jì)學(xué)是我校國(guó)家高水平公共衛(wèi)生學(xué)院建設(shè)主干學(xué)科,近年來(lái),聚焦統(tǒng)計(jì)遺傳與基因組學(xué)研究領(lǐng)域,進(jìn)行了卓有成效的探索,為高水平公共衛(wèi)生學(xué)院建設(shè)貢獻(xiàn)了力量。
原文鏈接:
https://www.nature.com/articles/s41416-024-02587-w