高通量測序(NGS)的過程及原理介紹
高通量測序技術(shù)的一般過程是將DNA(或cDNA)隨機(jī)片段化,加上接頭序列,制備用于上機(jī)測序的文庫,通過對文庫中數(shù)以萬計(jì)的克?。╟olony)進(jìn)行延伸反應(yīng),檢測對應(yīng)的信號獲取序列信息,最終通過數(shù)據(jù)分析來挖掘序列中的科學(xué)問題。
幾種不同測序平臺的原理及步驟如下:
(1)Roche 454平臺
Roche 454測序系統(tǒng)是第一個商業(yè)化運(yùn)營二代測序技術(shù)的平臺,也是首選將焦磷酸測序應(yīng)用在測序技術(shù)上的平臺。測序原理如下:
1)DNA文庫制備
454測序系統(tǒng)的文件構(gòu)建方式和illumina的不同,它是利用噴霧法將待測DNA打斷成300-800bp長的小片段,并在片段兩端加上不同的接頭,或?qū)⒋郎yDNA變性后用雜交引物進(jìn)行PCR擴(kuò)增,連接載體,構(gòu)建單鏈DNA文庫。
2)Emulsion PCR (乳液PCR,其實(shí)是一個注水到油的獨(dú)特過程)
454當(dāng)然DNA擴(kuò)增過程也和illumina的截然不同,它將這些單鏈DNA結(jié)合在水油包被的直徑約28um的磁珠上,并在其上面孵育、退火。
乳液PCR最大的特點(diǎn)是可以形成數(shù)目龐大的獨(dú)立反應(yīng)空間以進(jìn)行DNA擴(kuò)增。其關(guān)鍵技術(shù)是“注水到油”(水包油),基本過程是在PCR反應(yīng)前,將包含PCR所有反應(yīng)成分的水溶液注入到高速旋轉(zhuǎn)的礦物油表面,水溶液瞬間形成無數(shù)個被礦物油包裹的小水滴。這些小水滴就構(gòu)成了獨(dú)立的PCR反應(yīng)空間。理想狀態(tài)下,每個小水滴只含一個DNA模板和一個磁珠。
這些被小水滴包被的磁珠表面含有與接頭互補(bǔ)的DNA序列,因此這些單鏈DNA序列能夠特異地結(jié)合在磁珠上。同時孵育體系中含有PCR反應(yīng)試劑,所以保證了每個與磁珠結(jié)合的小片段都能獨(dú)立進(jìn)行PCR擴(kuò)增,并且擴(kuò)增產(chǎn)物仍可以結(jié)合到磁珠上。當(dāng)反應(yīng)完成后,可以破壞孵育體系并將帶有DNA的磁珠富集下來。進(jìn)過擴(kuò)增,每個小片段都將被擴(kuò)增約100萬倍,從而達(dá)到下一步測序所要求的DNA量。
3)焦磷酸測序
測序前需要先用一種聚合酶和單鏈結(jié)合蛋白處理帶有DNA的磁珠,接著將磁珠放在一種PTP平板上。這種平板上特制有許多直徑約為44um的小孔,每個小孔僅能容納一個磁珠,通過這種方法來固定每個磁珠的位置,以便檢測接下來的測序反應(yīng)過程。
測序方法采用焦磷酸測序法,將一種比PTP板上小孔直徑更小的磁珠放入小孔中,啟動測序反應(yīng)。測序反應(yīng)以磁珠上大量擴(kuò)增出的單鏈DNA為模板,每次反應(yīng)加入一種dNTP進(jìn)行合成反應(yīng)。如果dNTP能與待測序列配對,則會在合成后釋放焦磷酸基團(tuán)。釋放的焦磷酸基團(tuán)會與反應(yīng)體系中的ATP硫酸化學(xué)酶反應(yīng)生成ATP。生成的ATP和熒光素酶共同氧化使測序反應(yīng)中的熒光素分子并發(fā)出熒光,同時由PTP板另一側(cè)的CCD照相機(jī)記錄,最后通過計(jì)算機(jī)進(jìn)行光信號處理而獲得最終的測序結(jié)果。由于每一種dNTP在反應(yīng)中產(chǎn)生的熒光顏色不同,因此可以根據(jù)熒光的顏色來判斷被測分子的序列。反應(yīng)結(jié)束后,游離的dNTP會在雙磷酸酶的作用下降解ATP,從而導(dǎo)致熒光淬滅,以便使測序反應(yīng)進(jìn)入下一個循環(huán)。
由于454測序技術(shù)中,每個測序反應(yīng)都在PTP板上獨(dú)立的小孔中進(jìn)行,因而能大大降低相互間的干擾和測序偏差。454技術(shù)最大的優(yōu)勢在于其能獲得較長的測序讀長,當(dāng)前454技術(shù)的平均讀長可達(dá)400bp,并且454技術(shù)和illumina的Solexa和Hiseq技術(shù)不同,它最主要的一個缺點(diǎn)是無法準(zhǔn)確測量同聚物的長度,如當(dāng)序列中存在類似于PolyA的情況時,測序反應(yīng)會一次加入多個T,而所加入的T的個數(shù)只能通過熒光強(qiáng)度推測獲得,這就有可能導(dǎo)致結(jié)果不準(zhǔn)確。也正是由于這一原因,454技術(shù)會在測序過程中引入插入和缺失的測序錯誤。
(2)Illumina Solexa平臺
Illumina公司的Solexa和Hiseq應(yīng)該說是目前全球使用量最大的第二代測序機(jī)器,這兩個系列的技術(shù)核心原理是相同的,都是采用邊合成邊測序的方法,它的測序過程主要分為以下4步:
Illumina Solexa原理:橋式PCR+4色熒光可逆終止+激光掃描成像
①DNA文庫制備——超聲打斷加接頭
利用超聲波把待測的DNA樣本打斷成小片段,目前除了組裝之外和一些其他的特殊要求之外,主要是打斷成200-500bp長的序列片段,并在這些小片段的兩端添加上不同的接頭,構(gòu)建出單鏈DNA文庫。
②Flowcell——吸附流動DNA片段
Flowcell是用于吸附流動DNA片段的槽道,當(dāng)文庫建好后,這些文庫中的DNA在通過flowcell的時候會隨機(jī)附著在flowcell表面的channel上。每個Flowcell有8個channel,每個channel的表面都附有很多接頭,這些接頭能和建庫過程中加在DNA片段兩端的接頭相互配對(這就是為什么flowcell能吸附建庫后的DNA的原因),并能支持DNA在其表面進(jìn)行橋式PCR的擴(kuò)增。這樣就形成了數(shù)千份相同的單分子簇,被用做測序模板。
③橋式PCR擴(kuò)增與變性——放大信號
橋式PCR以Flowcell表面所固定的接頭為模板,進(jìn)行橋形擴(kuò)增,如圖4.a所示。經(jīng)過不斷的擴(kuò)增和變性循環(huán),最終每個DNA片段都將在各自的位置上集中成束,每一個束都含有單個DNA模板的很多分拷貝,進(jìn)行這一過程的目的在于實(shí)現(xiàn)將堿基的信號強(qiáng)度放大,以達(dá)到測序所需的信號要求。
④測序——測序堿基轉(zhuǎn)化為光學(xué)信號
測序方法采用邊合成邊測序的方法。向反應(yīng)體系中同時添加DNA聚合酶、接頭引物和帶有堿基特異熒光標(biāo)記的4中dNTP(如同Sanger測序法)。這些dNTP的3’-OH被化學(xué)方法所保護(hù),因而每次只能添加一個dNTP。在dNTP被添加到合成鏈上后,所有未使用的游離dNTP和DNA聚合酶會被洗脫掉。接著,再加入激發(fā)熒光所需的緩沖液,用激光激發(fā)熒光信號,并有光學(xué)設(shè)備完成熒光信號的記錄,最后利用計(jì)算機(jī)分析將光學(xué)信號轉(zhuǎn)化為測序堿基。這樣熒光信號記錄完成后,再加入化學(xué)試劑淬滅熒光信號并去除dNTP 3’-OH保護(hù)基團(tuán),以便能進(jìn)行下一輪的測序反應(yīng)。Illumina的這種測序技術(shù)每次只添加一個dNTP的特點(diǎn)能夠很好的地解決同聚物長度的準(zhǔn)確測量問題,它的主要測序錯誤來源是堿基的替換,目前它的測序錯誤率在1%-1.5%之間,測序周期以人類基因組重測序?yàn)槔?0x測序深度大約為1周。
(3)ABI Solid平臺
Solid測序技術(shù)是ABI公司于2007年開始投入用于商業(yè)測序應(yīng)用的儀器。它基于連接酶法,即利用DNA連接酶在連接過程之中測序,其流程及原理如下:
1)DNA文庫構(gòu)建
片段打斷并在片段兩端加上測序接頭,連接載體,構(gòu)建單鏈DNA文庫。
2)Emulsion PCR
Solid的PCR過程也和454的方法類似,同樣采用小水滴emulsion PCR,但這些微珠比起454系統(tǒng)來說則要小得多,只有1um。在擴(kuò)增的同時對擴(kuò)增產(chǎn)物的3’端進(jìn)行修飾,這是為下一步的測序過程作的準(zhǔn)備。3’修飾的微珠會被沉積在一塊玻片上。在微珠上樣的過程中,沉積小室將每張玻片分成1個、4個或8個測序區(qū)域(圖6-a)。Solid系統(tǒng)最大的優(yōu)點(diǎn)就是每張玻片能容納比454更高密度的微珠,在同一系統(tǒng)中輕松實(shí)現(xiàn)更高的通量。
3)連接酶測序
這一步是Solid測序的獨(dú)特之處。它并沒有采用以前測序時所常用的DNA聚合酶,而是采用了連接酶。Solid連接反應(yīng)的底物是8堿基單鏈熒光探針混合物,這里將其簡單表示為:3’-XXnnnzzz-5’。連接反應(yīng)中,這些探針按照堿基互補(bǔ)規(guī)則與單鏈DNA模板鏈配對。探針的5’末端分別標(biāo)記了CY5、Texas Red、CY3、6-FAM這4種顏色的熒光染料(圖6-a)。這個8堿基單鏈熒光探針中,第1和第2位堿基(XX)上的堿基是確定的,并根據(jù)種類的不同在6-8位(zzz)上加上了不同的熒光標(biāo)記。這是Solid的獨(dú)特測序法,兩個堿基確定一個熒光信號,相當(dāng)于一次能決定兩個堿基。這種測序方法也稱之為兩堿基測序法。當(dāng)熒光探針能夠與DNA模板鏈配對而連接上時,就會發(fā)出代表第1,2位堿基的熒光信號,圖6-a和圖6-b中的比色版所表示的是第1,2位堿基的不同組合與熒光顏色的關(guān)系。在記錄下熒光信號后,通過化學(xué)方法在第5和第6位堿基之間進(jìn)行切割,這樣就能移除熒光信號,以便進(jìn)行下一個位置的測序。不過值得注意的是,通過這種測序方法,每次測序的位置都相差5位。即第一次是第1、2位,第二次是第6、7位……在測到末尾后,要將新合成的鏈變性,洗脫。接著用引物n-1進(jìn)行第二輪測序。引物n-1與引物n的區(qū)別是,二者在與接頭配對的位置上相差一個堿基(圖6-a. 8)。也即是,通過引物n-1在引物n的基礎(chǔ)上將測序位置往3’端移動一個堿基位置,因而就能測定第0、1位和第5、6位……第二輪測序完成,依此類推,直至第五輪測序,最終可以完成所有位置的堿基測序,并且每個位置的堿基均被檢測了兩次。該技術(shù)的讀長在2×50bp,后續(xù)序列拼接同樣比較復(fù)雜。由于雙次檢測,這一技術(shù)的原始測序準(zhǔn)確性高達(dá)99.94%,而15x覆蓋率時的準(zhǔn)確性更是達(dá)到了99.999%,應(yīng)該說是目前第二代測序技術(shù)中準(zhǔn)確性最高的了。但在熒光解碼階段,鑒于其是雙堿基確定一個熒光信號,因而一旦發(fā)生錯誤就容易產(chǎn)生連鎖的解碼錯誤。
(4)Thermo Fisher Scientific Ion Torrent平臺
Ion Torrent 測序儀是第一個不需要光學(xué)系統(tǒng)的商業(yè)測序儀,所采用的技術(shù)為半導(dǎo)體測序,通過半導(dǎo)體芯片直接將化學(xué)信號轉(zhuǎn)換為數(shù)字信號,不同于前面提到的任何測序儀,可以稱之為“二代半”測序儀。其測序原理如下:
該技術(shù)使用了一種布滿小孔的高密度半導(dǎo)體芯片,一個小孔就是一個測序反應(yīng)池。在半導(dǎo)體芯片的微孔中固定DNA鏈,隨后依次摻入ACGT,當(dāng)DNA聚合酶把核苷酸聚合到延伸中的DNA鏈上時,會釋放出一個氫離子,反應(yīng)池中的PH發(fā)生改變,位于池下的離子感受器感受到H+離子信號,H+離子信號再直接轉(zhuǎn)化為數(shù)字信號,從而讀出DNA序列。如果檢測的DNA鏈上有兩個相同的堿基,將會檢測到電壓雙倍,芯片則記錄兩個相同的堿基。
a.測序流程圖,b.文庫制備,c.乳液PCR(前三個步驟與454技術(shù)類似),d. 測序過程
Ion Torrent半導(dǎo)體測序技術(shù)的發(fā)明人也是454測序技術(shù)的發(fā)明人之一——Jonathan Rothberg,它的文庫和樣本制備跟454技術(shù)很像,甚至可以說就是454的翻版,只是測序過程中不是通過檢測焦磷酸熒光顯色,而是通過檢測H+信號的變化來獲得序列堿基信息。由于對對個相同堿基的判讀是通過電信號來傳導(dǎo),Ion Torrent平臺在聚合酶上進(jìn)行了優(yōu)化,新推出的Hi-Q酶聚合反應(yīng)非常快,它產(chǎn)生的PH值變化的峰更高、更尖、更利于判讀,這在很大程度上提高了Ion Torrent測序儀判讀Homoploymer區(qū)域時的準(zhǔn)確性。
Ion Torrent相比于其他測序技術(shù)來說,不需要昂貴的物理成像等設(shè)備,因此,成本相對來說會低,體積也會比較小,同時操作也要更為簡單,速度也相當(dāng)快速,除了2天文庫制作時間,整個上機(jī)測序可在2-3.5小時內(nèi)完成,通量目前是10G左右,但非常適合小基因組和外顯子驗(yàn)證的測序。是一種經(jīng)濟(jì)、快速、簡單、規(guī)模可擴(kuò)展的測序技術(shù),非常適合擴(kuò)增子測序的革命性技術(shù)。
(5)華大基因BGISEQ平臺
自2013年華大基因收購Complete Genomics公司后,華大基因致力于開發(fā)基因測序平臺,還喊出了“打造中國人自己的測序平臺”的口號。2014年華大推出BGISEQ-1000、BGISEQ-100兩款測序儀,這兩款測序儀主要用于基因測序診斷領(lǐng)域,并于2018年1月被申請注銷,測序平臺已從原有的BGISEQ-100、BGISEQ-1000升級為BGISEQ-50、BGISEQ-500。BGISEQ-500及BGISEQ-50分別于2015、2016年推出,致力于拓展生育健康類測序業(yè)務(wù)。2017年華大又推出兩款測序儀MGISEQ-200和MGISEQ-2000,這兩款測序系統(tǒng)充分實(shí)現(xiàn)了低成本購機(jī)和低成本運(yùn)行,其廣泛的應(yīng)用領(lǐng)域,包括科學(xué)研究、臨床醫(yī)學(xué)、農(nóng)業(yè)、公安司法、環(huán)境工程等,實(shí)現(xiàn)了醫(yī)療和科研領(lǐng)域高通量測序系統(tǒng)的全面普及。
華大基因測序儀的與之前提到的4個測序平臺有所區(qū)別, BGISEQ/MGISEQ系列測序儀采用先進(jìn)的聯(lián)合探針錨定聚合技術(shù)(cPAS)和改進(jìn)的DNA納米球(DNB)核心測序技術(shù),將DNA分子錨與熒光探針在DNA納米球上進(jìn)行聚合,利用高分辨率成像系統(tǒng)對光信號進(jìn)行采集,并通過對光信號的數(shù)字化處理,最終獲得待測DNA序列信息。具體步驟如下:
1. DNA提取與片段化
準(zhǔn)備樣本 → DNA提取 → DNA片段化處理 → DNA片段末端修復(fù)
2. DNA片段擴(kuò)增(納米球技術(shù)DNB)
加接頭序列 → 分離出單股DNA → 成環(huán) → 滾環(huán)擴(kuò)增 → 形成DNA納米球(DNB)
基因組DNA首先經(jīng)過片段化處理,末端修復(fù)后再加上接頭序列,分離出單股DNA后并環(huán)化形成單鏈環(huán)狀DNA。環(huán)裝DNA在DNA聚合酶的作用下繞著DNA環(huán)不停地轉(zhuǎn)圈,復(fù)制出的上百份拷貝都在一股新DNA上,就像一股毛線卷成了毛線團(tuán)一樣,最后形成一團(tuán)DNA納米球(DNB, DNA Nano Ball),這一步即為滾環(huán)擴(kuò)增技術(shù)(Rolling circle amplification, RCA),可將單鏈環(huán)狀DNA擴(kuò)增2-3個數(shù)量級。
3. DNA序列識別
DNA納米球附著芯片 → 組合探針錨定連接法測序
DNB納米球經(jīng)過裝載技術(shù)固定在陣列化(Patterned Array)的硅芯片上,芯片每個位點(diǎn)的蛋白質(zhì)上自動附著上去一個DNB納米球并且不會發(fā)生堆疊。接下來就是測序過程了,華大測序儀采用了聯(lián)合探針錨定聚合(combinatorial Probe Anchor Synthesis,cPAS)技術(shù)進(jìn)行測序,首先DNA分子錨和熒光探針在DNB上進(jìn)行聚合,隨后高分辨率成像系統(tǒng)對光信號進(jìn)行采集,光信號經(jīng)過數(shù)字化處理后即可獲得待測序列。
4. 分析
堿基讀取 → 數(shù)據(jù)比對和組裝 → 基因組 → 結(jié)果分析
5. 技術(shù)優(yōu)勢
與其他二代測序技術(shù)相比較,DNB測序技術(shù)具有以下幾個優(yōu)勢:
(1)DNB通過增加待測DNA的拷貝數(shù)而增強(qiáng)了信號強(qiáng)度,從而提高測序準(zhǔn)確度;
(2)不同于PCR指數(shù)擴(kuò)增,滾環(huán)擴(kuò)增技術(shù)的擴(kuò)增錯誤不會累積;
(3)DNB與芯片上活化位點(diǎn)的大小相同,每個位點(diǎn)只固定一個DNB,保證信號點(diǎn)之間不產(chǎn)生相互干擾;
(4)陣列化測序芯片和DNB測序技術(shù)的結(jié)合,使得成像系統(tǒng)像素和測序芯片的面積得到最大化利用。?
-
科技前沿
-
焦點(diǎn)事件
-
焦點(diǎn)事件
-
科技前沿
-
科技前沿