English | 中文版 | 手機(jī)版 企業(yè)登錄 | 個人登錄 | 郵件訂閱
生物器材網(wǎng) logo
生物儀器 試劑 耗材
當(dāng)前位置 > 首頁 > 技術(shù)文章 > 人基因組DNA甲基化長讀長測序檢測方法比較

人基因組DNA甲基化長讀長測序檢測方法比較

瀏覽次數(shù):683 發(fā)布日期:2025-8-18  來源:本站 僅供參考,謝絕轉(zhuǎn)載,否則責(zé)任自負(fù)
長讀長測序最常用方法主要包括Oxford Nanopore Technologies(ONT)的納米孔測序和PacBio的單分子實時(SMRT)測序。近日,冰島deCODE Genetics公司/雷克雅未克大學(xué)Brynja D. Sigurpalsdottir等人系統(tǒng)比較了長讀長測序技術(shù)(ONT和SMRT測序)在檢測人基因組DNA甲基化(特別是CpG甲基化)方面的性能。研究共使用7,179個ONT測序樣本、132個精準(zhǔn)甲基化測序(oxBS)樣本和50個SMRT測序樣本,詳細(xì)評估不同測序技術(shù)和分析工具在檢測CpG甲基化(5-mCpG)時的準(zhǔn)確性、一致性及局限性。研究還引入了質(zhì)量過濾器以提高甲基化檢測的準(zhǔn)確性,并強(qiáng)調(diào)了最新一代ONT R10.4芯片技術(shù)在甲基化檢測中的優(yōu)勢。相關(guān)研究成果以《A comparison of methods for detecting DNA methylation from long-read sequencing of human genomes》為題發(fā)表于《Genome Biology》期刊。
 

標(biāo)題:A comparison of methods for detecting DNA methylation from long-read sequencing of human genomes(人基因組DNA甲基化長讀長測序檢測方法比較)
發(fā)表時間:2024-03-11
發(fā)表期刊:Genome Biology
影響因子:IF10.1/Q1
技術(shù)平臺:ONT、oxBS、SMRT
DOI10.1186/s13059-024-03207-9

本研究揭示了7,179個納米孔測序的DNA樣本中檢測到的CpG甲基化具有高度準(zhǔn)確性和一致性,與相同血液樣本中分離出來的132個精準(zhǔn)甲基化測序(oxBS)樣本的檢測結(jié)果相匹配。研究引入靶向CpG位點的質(zhì)量過濾器(過濾約30%的CpG)以進(jìn)一步提高納米孔測序CpG甲基化檢測的準(zhǔn)確性。研究評估了在不同基因組特征和CpG甲基化率下,每個位點的CpG甲基化檢測性能,并展示了最新的ONT R10.4芯片和堿基識別算法優(yōu)化ONT納米孔測序中的甲基化檢測的具體過程。此外,研究還納入了50個SMRT測序樣本基因組的甲基化檢測結(jié)果和oxBS測序的結(jié)果,與ONT測序進(jìn)行橫向比較研究闡明了每種測序方法的優(yōu)勢和局限性,并為使用長讀長測序進(jìn)行基因組規(guī)模的堿基修飾檢測工具的標(biāo)準(zhǔn)化和評估提出了建議。

研究方法
ONT測序:使用PromethION R9.4和R10.4芯片,通過檢測DNA分子通過納米孔時的電流變化來識別甲基化修飾。
SMRT測序:通過檢測DNA合成過程中堿基摻入的動力學(xué)變化來識別甲基化修飾。
oxBS測序:通過化學(xué)氧化和亞硫酸鹽處理精準(zhǔn)區(qū)分5-甲基胞嘧啶(5-mC)和5-羥甲基胞嘧啶(5-hmC)。
數(shù)據(jù)分析工具:
  • Nanopolish:使用隱馬爾可夫模型(HMM)為每個CpG位點分配甲基化狀態(tài)。
  • Guppy:基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)工具,可在堿基識別階段直接檢測CpG甲基化。
  • Primrose:SMRT測序數(shù)據(jù)的甲基化檢測,通過結(jié)合鄰近CpG位點的動態(tài)信息來提高檢測準(zhǔn)確性。
質(zhì)量過濾器:引入多種質(zhì)量過濾器,包括過濾序列變異周圍CpG位點、低質(zhì)量區(qū)域(如暗區(qū))CpG位點以及異常測序深度或高鏈偏倚的CpG位點。
 
結(jié)果圖形
(1)ONT納米孔測序檢測CpG甲基化
研究首先利用promethION平臺對7,179名個體全血樣本進(jìn)行Nanopore測序,平均測序度為20.6×(中位數(shù)為19.5×,范圍從10×到108×)。同一樣本還被用于研究CpG甲基化、基因表達(dá)和序列變異之間的相關(guān)性。研究通過Nanopolish工具進(jìn)行CpG甲基化檢測,該工具將相距10bp以內(nèi)的CpG位點歸為一個單元,稱為CpG單元。Nanopolish以參考基因組比對的reads為input和每個read數(shù)據(jù)參考基因組的鏈信息,為每個CpG單元判斷其對數(shù)似然比(LLR)。LLR為二進(jìn)制值,表示測序CpG位點甲基化狀態(tài)。當(dāng)LLR未達(dá)到預(yù)測CpG單元為甲基化或未甲基化標(biāo)準(zhǔn)時,將CpG單元分類為“不可靠”。本研究分析范圍為隊列中Nanopolish檢測到的22,178,458個常染色體CpG單元,共27,651,488個CpG位點。
 
(2)ONT測序和oxBS的CpG甲基化檢測比較
研究對132個個體的DNA樣本進(jìn)行Nanopore測序和oxBS測序比較分析以評估Nanopore測序在CpG甲基化檢測中的準(zhǔn)確性。樣本平均測序深度為25×,每個CpG單元在兩個數(shù)據(jù)集中分別計算了所有個體的平均5-mCpG率,并通過皮爾遜相關(guān)系數(shù)(APC)來評估Nanopolish工具性能。結(jié)果顯示,兩個數(shù)據(jù)集之間的APC非常高(r=0.9594),表明Nanopore測序的甲基化檢測結(jié)果與oxBS測序結(jié)果高度一致。

 

圖1:ONT測序和oxBS在同一DNA樣本中5-甲基胞嘧啶(5-mCpG)率的一致性表現(xiàn)。

 
A.   132個DNA樣本中ONT(紅色)和oxBS(綠色)的5-mCpG率整體檢測值。
B-C.  ONT測序中每個CpG位點的5-mCpG率的皮爾遜相關(guān)系數(shù)r(B)和平均絕對差異(MAD)(C)。
D.   ONT測序樣本中用于分析特定CpG位點的5-mCpG率的序列數(shù)量(X軸),影響與oxBS高深度檢測5-mCpG率的一致性(皮爾遜相關(guān)系數(shù)r,Y軸)。
E.   ONT測序(Y軸)和oxBS(X軸,分組)中的CpG率。平均值紅色(ONT)和綠色(oxBS)。
F.    樣本間比較通過ONT測序正確分類的CpG位點數(shù)量(Y軸,單位=/M CpGs,藍(lán)色)。錯誤分類的CpG位點根據(jù)5-mCpG率的MAD著色(顏色圖例)。D/E/F中的oxBS位點測序深度>25×。
 
(3)測序深度影響ONT測序數(shù)據(jù)中CpG甲基化檢測的一致性
研究進(jìn)一步探討了測序深度對Nanopore測序CpG甲基化檢測一致性的影響。結(jié)果顯示,測序深度越高,CpG甲基化檢測一致性越好。當(dāng)測序深度在12×或更高時,皮爾遜相關(guān)系數(shù)顯著提高,而20×或更高的測序深度時,檢測結(jié)果一致性進(jìn)一步提高。當(dāng)測序深度低于10×時,甲基化檢測準(zhǔn)確性會顯著下降。這一結(jié)果表明,較高的測序深度能夠顯著提高CpG甲基化檢測的準(zhǔn)確性和一致性。為了獲得高準(zhǔn)確性的CpG甲基化檢測結(jié)果,建議每個樣本的測序深度至少為12×,20×或更高則更為理想。
 
(4)ONT測序數(shù)據(jù)在未甲基化和高甲基化CpG單元中的一致性更高
研究發(fā)現(xiàn),ONT測序在未甲基化和高甲基化CpG單元的檢測上表現(xiàn)更為一致。研究將CpG位點分為未甲基化(0–0.15)、低甲基化(0.15–0.5)、中等甲基化(0.5–0.85)和高甲基化(0.85–1)四個類別,通過比較ONT測序和oxBS的結(jié)果顯示,Nanopore測序在未甲基化和高甲基化CpG單元上的預(yù)測準(zhǔn)確性最高,分別為86%和77%。這表明Nanopore測序在極端甲基化狀態(tài)下檢測更為可靠,而在低甲基化和中等甲基化狀態(tài)下的檢測準(zhǔn)確性相對較低,分別為52%和56%。這一結(jié)果為研究者在選擇測序技術(shù)和分析工具時提供重要的參考依據(jù)。
 
(5)Nanopolish甲基化檢測質(zhì)量受CpG單元序列背景影響
研究發(fā)現(xiàn),Nanopolish甲基化檢測質(zhì)量受CpG單元序列背景的影響。為了分析這種影響,研究者將CpG單元分為序列變異周圍(5bp以內(nèi))、“暗區(qū)”(即難以可靠比對的區(qū)域)、具有異常測序深度(高于平均深度1.5倍或低于平均深度0.5倍)以及存在鏈偏倚(大于0.2)的4個CpG單元。分析結(jié)果表明,序列變異周圍CpG位點(5bp以內(nèi))的預(yù)測準(zhǔn)確性較低,其APC為0.9219,而其他CpG位點的APC為0.9656。此外,“暗區(qū)”CpG位點APC也較低,為0.698。這些結(jié)果表明,序列背景對Nanopore測序的甲基化檢測準(zhǔn)確性有顯著影響。因此,在進(jìn)行CpG甲基化檢測時,需要特別關(guān)注這些區(qū)域的質(zhì)控,以提高檢測結(jié)果的可靠性。

 

圖2:根據(jù)DNA序列屬性評估5-mCpG率檢測質(zhì)量。

 
A.  比較位于特定序列屬性內(nèi)部(灰色)和外部(粉色)的CpG位點的平均皮爾遜相關(guān)系數(shù)(APC)。
B.  每個屬性內(nèi)部的CpG單元(紅色)和位點(綠色)數(shù)量。
C.  單個CpG單元(單例)和多CpG位點單元(非單例)中高質(zhì)量(深藍(lán)色)與非高質(zhì)量(淺藍(lán)色)CpG單元的比例。
D.  不同甲基化狀態(tài)類別中高質(zhì)量和非高質(zhì)量CpG單元比例。
 
(6)與oxBS數(shù)據(jù)的對比分析中,Guppy在CpG位點甲基化檢測上表現(xiàn)優(yōu)于Nanopolish
研究比較了Guppy和Nanopolish在CpG位點的甲基化檢測。分析結(jié)果表明Guppy在與oxBS測序結(jié)果的對比分析中表現(xiàn)優(yōu)于Nanopolish。具體而言,Guppy與oxBS測序結(jié)果的APC為0.97256,高于Nanopolish的0.9594。且Guppy平均鏈偏倚更低,表明其甲基化檢測準(zhǔn)確性更高。通過應(yīng)用與Nanopolish相同的質(zhì)量過濾器,Guppy能夠鑒定出更多的高質(zhì)量CpG位點(hq-CpGs),其APC為0.98691。這一結(jié)果表明,Guppy在CpG甲基化檢測上具有更高的準(zhǔn)確性和可靠性,特別是在處理低甲基化和中等甲基化狀態(tài)下的CpG位點時表現(xiàn)更為出色。
 
(7)最新的Nanopore R10.4芯片技術(shù)在甲基化檢測上實現(xiàn)了更高準(zhǔn)確性和改進(jìn)的檢測結(jié)果
研究人員對ONT的最新R10.4芯片在CpG甲基化檢測方面的表現(xiàn)進(jìn)行了評估,并與早期的R9.4芯片進(jìn)行了比較。研究發(fā)現(xiàn),R10.4芯片在多個方面表現(xiàn)出顯著的優(yōu)勢,特別是在提高甲基化檢測的準(zhǔn)確性和減少鏈偏倚方面。
  • 更高的APC:在所有CpG位點中,R10.4芯片預(yù)測的5-mCpG率與oxBS數(shù)據(jù)的APC為0.97845,高于R9.4芯片的0.97256。表明R10.4芯片在甲基化檢測上的準(zhǔn)確性更高。
  • 更低的MAD:Guppy R10.4在與oxBS的甲基化檢測比較中顯示出比Guppy R9.4更低的MAD,進(jìn)一步證明了其在甲基化檢測上的準(zhǔn)確性。
  • 更低的鏈偏倚:R10.4芯片的平均鏈偏倚為0.047,顯著低于R9.4芯片的0.064。鏈偏倚是指正鏈和負(fù)鏈上預(yù)測的甲基化率差異,較低的鏈偏倚表明R10.4芯片在甲基化檢測上的可靠性更高。
  • 更多的高質(zhì)量CpG位點:應(yīng)用相同的質(zhì)量過濾器,R10.4芯片能夠鑒定出更多的高質(zhì)量CpG位點(hq-CpGs),數(shù)量達(dá)到22893522個(82.8%),與R9.4芯片相比增加了2.3%。表明R10.4芯片在提高甲基化檢測位點覆蓋率方面具有顯著優(yōu)勢。
  • 高質(zhì)量CpG位點更高的APC:這些高質(zhì)量CpG位點的APC為0.99067,表明R10.4芯片在甲基化檢測上的準(zhǔn)確性非常高。
 
(8)ONT測序與SMRT測序的CpG甲基化檢測比較
研究以50個oxBS樣本作為參考標(biāo)準(zhǔn),對50個SMRT測序樣本、50個ONT測序樣本(分別使用R9.4和R10.4芯片)的CpG甲基化檢測數(shù)據(jù)進(jìn)行比較分析。研究對所有樣本的平均5-mCpG率進(jìn)行分析,并比較所有五種方法(SMRT、R9.4-Guppy、R10.4-Guppy、R9.4-Nanopolish和oxBS)之間的平均皮爾遜相關(guān)系數(shù)(APC)以及5-mCpG率與oxBS之間的平均絕對差異(MAD)(表1A)。

 
表1:不同測序技術(shù)在CpG甲基化檢測中的一致性和準(zhǔn)確性比較
 
(A)  APC比較結(jié)果展示在主對角線以下,MMAD比較結(jié)果展示在主對角線以上。
(B)  基于所有CpG、序列變異周圍CpG或暗區(qū)CpG位點的APC比較分析。
 
結(jié)果顯示,Guppy R10.4和Guppy R9.4在與oxBS數(shù)據(jù)的比較中表現(xiàn)最佳,其平均皮爾遜相關(guān)系數(shù)(APC)最高,分別為0.97845和0.97256。表明Guppy在甲基化檢測上的準(zhǔn)確性最高,能夠最接近oxBS測序的參考標(biāo)準(zhǔn)。研究還分析了不同測序技術(shù)在CpG甲基化率分布上的表現(xiàn)。所有測序技術(shù)均能準(zhǔn)確復(fù)現(xiàn)oxBS測序觀察到的CpG甲基化率的雙峰分布,Guppy R10.4的分布與oxBS測序結(jié)果最為接近,表明其在極端甲基化狀態(tài)下的檢測更為準(zhǔn)確。
此外,CpG周圍的序列變異會在oxBS中引入比對偏倚,導(dǎo)致甲基化檢測不準(zhǔn)確和APC降低(表1B)。因此對于Guppy和PacBio而言,序列變異周圍CpG位點的重要性較低。所有長讀長測序技術(shù)都使用特定序列背景和與參考基因組的比較來檢測CpG甲基化狀態(tài),因此可以過濾那些序列變異周圍的CpG位點。
 
(9)5-mCpG率的分布
研究分析了不同測序技術(shù)在CpG甲基化率分布上的表現(xiàn)。結(jié)果顯示,所有測序技術(shù)在CpG甲基化率的分布上表現(xiàn)出預(yù)期的雙峰分布,但在完全甲基化和完全未甲基化狀態(tài)下的分布略有差異。Guppy R10.4測序結(jié)果與oxBS測序結(jié)果最為接近,而SMRT測序和Guppy R9.4測序結(jié)果則在極端甲基化狀態(tài)下表現(xiàn)出一定的偏倚。這一結(jié)果表明,不同測序技術(shù)在處理低甲基化和中等甲基化狀態(tài)下的CpG位點時可能存在差異,研究者在選擇測序技術(shù)時需要考慮這些因素。

 
圖3:不同方法檢測CpG甲基化的比較。
 
A. 在oxBS、Guppy R9.4和R10.4中,CpG甲基化率(0-1)在個體中平均后呈現(xiàn)出oxBS數(shù)據(jù)中預(yù)期的雙峰分布。
B. 在oxBS、PacBio和Nanopore中,CpG甲基化率(0-1)在個體中平均后呈現(xiàn)出oxBS數(shù)據(jù)中預(yù)期的雙峰分布。
C. 全血中表達(dá)基因的轉(zhuǎn)錄起始位點(TSS)的CpG甲基化率在50bp范圍內(nèi)平均值。
D. 每種方法檢測到的CpG位點數(shù)量。Nanopolish統(tǒng)計每個CpG單元的所有CpG位點。
 
(10)功能區(qū)域的5-mCpG分布
為了研究生物學(xué)背景對甲基化檢測準(zhǔn)確性的作用,研究人員分析了全血中表達(dá)基因的TSS處50bp以內(nèi)的平均5-mCpG率。所有甲基化檢測方法都高度匹配oxBS測序樣本中的甲基化模式,表明在TSS區(qū)域內(nèi)甲基化缺失(圖3C)。其中PacBio和Guppy R9.4在TSS處顯示出更高的CpG甲基化率,而在TSS之外則顯示出低甲基化率,這與這兩種方法的甲基化分布輕微偏移一致(圖3A、B)。而Guppy R10.4測序結(jié)果更接近于oxBS中的TSS甲基化水平(圖3C)。表明其在功能區(qū)域的甲基化檢測上具有高準(zhǔn)確性。這一結(jié)果進(jìn)一步證實了Guppy R10.4測序技術(shù)在表觀遺傳學(xué)研究中的應(yīng)用潛力,特別是在基因表達(dá)調(diào)控和細(xì)胞分化機(jī)制研究中。
 
(11)長讀長測序比oxBS測序檢測到更多的CpG位點數(shù)量
研究發(fā)現(xiàn),長讀長測序技術(shù)在檢測CpG位點數(shù)量上優(yōu)于oxBS測序。Nanopore測序和SMRT測序平均每個樣本檢測到約27M CpG位點(Guppy R9.4=27,467,383個CpG位點,Guppy R10.4=27369144個CpG位點,PacBio=26,739,539個CpG位點,Nanopolish=26,487,587個CpG位點,分布在22,058,476個CpG單元中),而oxBS測序僅檢測到約26M CpG位點(圖3D)。這一結(jié)果表明,長讀長測序技術(shù)在CpG甲基化檢測上具有更高的分辨率和更全面的覆蓋范圍,能夠為研究者提供更豐富的表觀遺傳學(xué)信息。這一優(yōu)勢在研究復(fù)雜基因組區(qū)域和稀有甲基化中尤為顯著。
 
討論和啟示
本研究通過大規(guī)模樣本分析,揭示了長讀長測序技術(shù)在CpG甲基化檢測中的優(yōu)勢和局限性。研究揭示了測序深度、鏈偏倚、序列背景等因素對甲基化檢測的準(zhǔn)確性有顯著影響。同時,長讀長測序技術(shù)在檢測CpG甲基化方面具有顯著優(yōu)勢,尤其是在無需化學(xué)處理DNA的情況下直接檢測甲基化修飾的能力。最新的R10.4芯片技術(shù),通過降低鏈偏倚和提高檢測準(zhǔn)確性,進(jìn)一步提升了ONT測序在甲基化檢測中的性能。未來的研究可以利用這些技術(shù)優(yōu)勢,深入探索基因表達(dá)調(diào)控、細(xì)胞分化以及疾病發(fā)生機(jī)制等領(lǐng)域的表觀遺傳學(xué)變化。
 
參考文獻(xiàn):
Sigurpalsdottir, B.D., Stefansson, O.A., Holley, G. et al. A comparison of methods for detecting DNA methylation from long-read sequencing of human genomes. Genome Biol 25, 69 (2024). Doi:10.1186/s13059-024-03207-9
發(fā)布者:深圳市易基因科技有限公司
聯(lián)系電話:0755-28317900
E-mail:wuhuanhuan@e-gene.cn

標(biāo)簽: DNA甲基化
用戶名: 密碼: 匿名 快速注冊 忘記密碼
評論只代表網(wǎng)友觀點,不代表本站觀點。 請輸入驗證碼: 8795
Copyright(C) 1998-2026 生物器材網(wǎng) 電話:021-64166852;13621656896 E-mail:info@bio-equip.com