2019-ncov的基因組為?
冠狀病毒主要引起呼吸道和胃腸道感染,并且在遺傳學上被分為四個主要的病毒屬:甲型冠狀病毒(Alphacoronavirus)、乙型冠狀病毒(Betacoronavirus)、丙型冠狀病毒(Gammacoronavirus)和丁型冠狀病毒(Deltacoronavirus)。前兩個屬主要感染哺乳動物,而后兩個屬主要感染鳥類。
人們先前已鑒定六種人類冠狀病毒,包括HCoV-NL63和HCoV-229E,它們屬于甲型冠狀病毒;HCoV-OC43、HCoV-HKU1、重癥急性呼吸綜合征(SARS)冠狀病毒(SARS-CoV)和中東呼吸綜合征(MERS)冠狀病毒(MERS-CoV),屬于乙型冠狀病毒。直到2003年SARS大流行、2012年MERS疫情和近期的2019-nCoV疫情發(fā)生后,冠狀病毒才引起全球關注。SARS-CoV和MERS-CoV被認為是高致病性的,而且SARS-CoV和MERS-CoV可能由蝙蝠傳播給果子貍或單峰駝,最后傳播給人類。
冠狀病毒的基因組大小在26000至32000個堿基之間,包括可變數量(6至11個)的開放閱讀框(ORF)。第一個ORF大約占整個基因組的67%,編碼16種非結構蛋白(non-structural protein, nsp),剩下的ORF編碼輔助蛋白和結構蛋白。四種主要的結構蛋白是刺突表面糖蛋白(S)、小包膜蛋白(E)、基質蛋白(M)和核衣殼蛋白(N)。S蛋白在結合到宿主細胞表面上的受體中起著至關重要的作用,并且決定著宿主趨向性。
SARS-CoV的S蛋白和MERS-CoV的S蛋白通過不同的受體結合結構域(RBD)與不同的宿主受體結合。SARS-CoV使用血管緊張素轉換酶2(ACE2)作為主要受體之一,并使用CD209L作為替代受體,而MERS-CoV使用二肽基肽酶4(DPP4,也稱為CD26)作為主要受體。初步分析提示著2019-nCoV與蝙蝠SARS樣冠狀病毒(SARS-like CoV)具有密切的進化關聯性。
在一項新的研究中,來自中國醫(yī)學科學院北京協(xié)和醫(yī)學院、中國疾病預防控制中心病毒病預防控制所、中南大學、蘇州大學和湖南大學的研究人員根據新冠狀病毒2019-nCoV---的前三個已確定的基因組,即Wuhan/IVDC-HB-01/2019(GISAID登錄號:EPI_ISL_402119)(HB01),Wuhan/IVDC-HB-04/2019( EPI_ISL_402120)(HB04)和Wuhan/IVDC-HB-05/2019(EPI_ISL_402121)(HB05),對這種病毒進行了深入的基因組注釋,并與相關冠狀病毒進行了比較,這些相關冠狀病毒包括1008個人SARS-CoV,338個蝙蝠SARS-like CoV和3131個人MERS-CoV,它們的基因組在2020年1月12日(發(fā)布日期:2019年9月12日)之前已在病毒病原體數據庫(Virus Pathogen Database)、分析資源(Analysis Resource, ViPR)(http://www.viprbrc.org)和美國國家生物技術信息中心(NCBI)上發(fā)表。
相關研究結果于2020年2月7日在線發(fā)表在Cell Host & Microbe期刊上,論文標題為“Genome Composition and Divergence of the Novel Coronavirus (2019-nCoV) Originating in China”。
對這三種2019-nCoV毒株的基因組序列進行比較顯示它們幾乎是一樣的,在大約29.8 kb的基因組中僅有5個核苷酸不同。對2019-nCoV基因組進行注釋后發(fā)現它有14個ORF,編碼27種蛋白(圖1A)。位于這種基因組5'末端的orf1ab和orf1a基因分別編碼pp1ab和pp1a蛋白。這兩種蛋白總共包含15種nsp,具體為nsp1至nsp10和nsp12至nsp16(圖1A)。這種基因組的3'端包含四種結構蛋白(S、E、M和N)和八種輔助蛋白(3a、3b、p6、7a、7b、8b、9b和orf14)。
在氨基酸水平上,2019-nCoV與SARS-CoV非常相似,但也有一些顯著差異。比如,8a蛋白存在于SARS-CoV中,而在2019-nCoV中不存在;8b蛋白在SARS-CoV中為84個氨基酸,但在2019-nCoV中則較長,為121個氨基酸;3b蛋白在SARS-CoV中為154個氨基酸,但在2019-nCoV中則較短,只有22個氨基酸。還需開展進一步的研究來闡明這些差異如何影響2019-nCoV的功能和發(fā)病機理。
圖1.2019-nCoV的基因組組成和系統(tǒng)進化樹,圖片來自Cell Host & Microbe, 2020, doi:10.1016/j.chom.2020.02.001。
正如利用分子進化遺傳學分析(MEGA)(版本7.0)構建出的基于全基因組的系統(tǒng)進化樹(圖1B和S2)所顯示的那樣,2019-nCoV與MERS-CoV、蝙蝠SARS-like CoV和SARS-CoV處于相同的乙型冠狀病毒進化枝中。這種系統(tǒng)進化樹分為兩個進化枝。
乙型冠狀病毒屬構成一個進化枝,而甲型冠狀病毒、丙型冠狀病毒和丁型冠狀病毒屬構成另一個進化枝。2019-nCoV與蝙蝠SARS-like CoV平行進化,而SARS-CoV由蝙蝠SARS-like CoV進化而來,這表明就全基因組序列而言,相比于SARS-CoV,2019-nCoV與蝙蝠SARS-like CoV存在更密切的親緣關系。
相關數據還顯示2019-nCoV的基因組與蝙蝠SARS-like CoV(MG772933)的基因組具有最高相似性。相比之下,2019-nCoV與MERS-CoV的進化距離較遠,親緣關系也不密切。針對pp1ab、pp1a、E、M、7a和N基因的編碼蛋白的系統(tǒng)進化樹分析顯示2019-nCoV最接近于蝙蝠SARS-like CoV(圖1C)。
就S基因而言,2019-nCoV最接近于蝙蝠冠狀病毒,而它的3a和8b基因都最接近于SARS-CoV。盡管不論是在整個基因組上還是在單個基因上的系統(tǒng)進化樹分析都明確表明,2019-nCoV與蝙蝠SARS-like CoV存在最密切的親緣關系(圖1B和1C),但是這些研究人員沒有發(fā)現單個蝙蝠SARS-like CoV毒株含有的所有蛋白都與2019-nCoV最為相似(圖1B和1C)。
鑒于2019-nCoV與SARS-CoV或蝙蝠SARS-like CoV之間存在密切的親緣關系(圖1B和1C),對不同蛋白中氨基酸替換的研究可能能夠揭示2019-nCoV在結構和功能上與SARS-CoV有何不同。在2019-nCoV(HB01)的氨基酸序列與SARS-CoV和蝙蝠SARS-like CoV的對應共有序列(consensus sequence)之間共有380個氨基酸替換(圖2)。在nsp7蛋白、nsp13蛋白、E蛋白、M蛋白、輔助蛋白p6和8b中均未發(fā)生氨基酸替換。nsp3和nsp2中分別有102個和61個氨基酸替換。
此外,在長1273個氨基酸的S蛋白中發(fā)現了27個氨基酸替換,包括RBD中的氨基酸區(qū)域357-528有6個氨基酸替換,在基礎亞結構域(SD)中的氨基酸區(qū)域569-655有6個氨基酸替換。在受體結合亞基S1結構域的C端(圖2)存在的4個氨基酸替換(Q560L、S570A、F572T和S575A)位于兩個以前被報道為SARS-CoV抗原的肽中。
圖2.2019-nCoV相比于SARS-CoV和SARS-like CoV發(fā)生的氨基酸替換,圖片來自Cell Host & Microbe, 2020, doi:10.1016/j.chom.2020.02.001。
由于對這種新型病毒的了解非常有限,這些研究人員無法對2019-nCoV與SARS-CoV或SARS-like CoV之間存在的大量氨基酸替換給出合理的解釋。比如,2019-nCoV和SARS-CoV中與人受體ACE2蛋白直接相互作用的受體結合基序中不存在氨基酸替換,但在RBD的其他區(qū)域發(fā)生了六個突變。與SARS-CoV相比,這些差異是否會影響2019-nCoV的宿主趨向性和傳播特性值得在未來開展進一步的研究。
參考資料:
Aiping Wu et al. Genome Composition and Divergence of the Novel Coronavirus (2019-nCoV) Originating in China. Cell Host & Microbe, 2020, doi:10.1016/j.chom.2020.02.001.
-
科技前沿
-
焦點事件
-
焦點事件
-
焦點事件
-
焦點事件
-
焦點事件
-
焦點事件
-
項目成果
-
項目成果
-
焦點事件