呂慶研究組提出快速估計(jì)大基因型數(shù)據(jù)SNP遺傳度估計(jì)方法
復(fù)雜性狀的表型變異是遺傳因素和環(huán)境因素共同作用的結(jié)果,基因與環(huán)境因素對表型變異有著重要的影響。遺傳度是衡量群體中某一表型差異歸因于遺傳因素的比例。遺傳度估計(jì)可以量化表型在多大程度上受基因影響;給出用基因預(yù)測表型的上限,比較不同人群中同一表型的遺傳起源。大基因型數(shù)據(jù)能夠提高估計(jì)精度,但是要求的計(jì)算資源高,計(jì)算耗時(shí)長。
2022年4月5號(hào),《生物信息學(xué)簡報(bào)》在線發(fā)表了Mingsheng Tang, Tingting Hou, Xiaoran Tong等人報(bào)道了基于最小范數(shù)二次無偏估計(jì)(MINQUE)和分批處理法(Batch)的SNP遺傳度快速估計(jì)方法。
對于非分批處理法,無論是單方差還是多方差分析,LMM.MNQ是無偏的遺傳度估計(jì)方法,且隨著樣本量的增加,估計(jì)越精確。對于分批處理法,無論單方差還是多方差分析,LMM.MNQ.BCH是無偏的估計(jì)方法,隨著批次樣本量和批次數(shù)目的增加,LMM.MNQ.BCH估計(jì)越精確。分批處理法是普遍適用的方法,可用于那些能給出無偏遺傳度估計(jì)的方法來減少計(jì)算負(fù)擔(dān)。對于計(jì)算時(shí)間,模擬和實(shí)例研究表明,LMM.MNQ.BCH的估計(jì)結(jié)果和現(xiàn)有的方法BOLT-REML估計(jì)的結(jié)果相近,但是明顯快于后者。
現(xiàn)已開發(fā)出以核矩陣或PLINK文件作為輸入數(shù)據(jù)的可執(zhí)行程序。小數(shù)據(jù)集時(shí),LMM.MNQ為SNP遺傳度估計(jì)提供了另一種可行方法;大數(shù)據(jù)集時(shí), LMM.MNQ.BCH要求的計(jì)算資源少,可以應(yīng)用于個(gè)人計(jì)算機(jī),而不依賴于計(jì)算集群。除了估計(jì)遺傳度,LMM.MNQ, LMM.MNQ.BCH也可進(jìn)行關(guān)聯(lián)檢驗(yàn)。