-
SNP分型的關(guān)鍵難點(diǎn):高同源區(qū)段類型解析
發(fā)布時(shí)間: 2025-11-11 點(diǎn)擊次數(shù): 210次高等動(dòng)植物基因組中含有大量高同源序列,例如人類基因組中高度重復(fù)序列占比就超過50%。這些序列給SNP分型帶來顯著挑戰(zhàn),主要包括以下幾類高同源區(qū)段:
1.亞基因組
多倍體生物中,由不同祖先基因組分化形成的同源染色體組,保留獨(dú)立基因簇,但存在高度同源序列。植物和魚類等生物由于遠(yuǎn)緣雜交或染色體加倍具有異源多倍體(亞基因組)。常見的小麥和鯉魚就是天然多倍體。
2.假基因
基因組中與功能基因(稱為“編碼基因")序列相似,但失去了編碼蛋白質(zhì)的能力的DNA片段。如人血紅蛋白ψβ1含多個(gè)終止突變;人磷酸甘油酸激酶ψ1則是因?yàn)?/span>mRNA逆轉(zhuǎn)錄插入缺失啟動(dòng)子。
3.重復(fù)序列
還有一類是重復(fù)序列(主要是轉(zhuǎn)座子)SNP變異,分析這些內(nèi)部SNP可以追溯重復(fù)序列擴(kuò)增的歷史時(shí)序,區(qū)分功能性拷貝與缺陷拷貝。
4.同源基因
基因家族序列同源性很高,通過常規(guī)測序或比對難以精確定位到具體哪個(gè)成員。但在進(jìn)化過程中會(huì)積累成員特異性的SNP,可以用來精確區(qū)分,確定某個(gè)序列讀長或變異來源于哪個(gè)特定成員。人和小鼠的P450基因家族是直系同源(物種分化形成),而人HLA基因家族則是旁系同源(基因復(fù)制形成,功能可能分化)。
高同源區(qū)段SNP檢測存在諸多難點(diǎn)。如下圖所示,常見技術(shù)的PCR引物難以區(qū)分高同源區(qū)段,易出現(xiàn)非特異性擴(kuò)增/雜交等問題。




產(chǎn)品分類

