陰謀論可別逗了,新冠病毒才不是生化武器!
2020年1月31日,印度理工學(xué)院德里分校的研究人員在bioRxiv上發(fā)表了一篇論文,稱新型冠狀病毒是人為改造的病毒,因其刺突蛋白S蛋白上含有四個(gè)插入片段,這些片段與HIV-1的某些片段完全同源或具有相似性。這篇未經(jīng)審稿的論文掀起了諸多討論,雖然已被撤稿,但依舊給人們留下了疑問(wèn)。2月14日,杜克大學(xué)醫(yī)學(xué)中心的Chuan Xiao等人在Emerging Microbes & Infections雜志上發(fā)文,分析了新冠病毒中這四個(gè)插入片段與hiv-1等其他基因的同源性,駁斥了2019-nCoV可能是通過(guò)人為獲得HIV-1基因組中的一些基因片段而產(chǎn)生的“生化武器”這種觀點(diǎn)。
撰文 | Chuan Xiao 等
翻譯 | 徐穎、顧舒晨

當(dāng)一種新的病原體肆虐人類世界之時(shí),探尋它的起源往往是一個(gè)亟待解決的關(guān)鍵問(wèn)題。了解病原體的來(lái)源對(duì)阻止其進(jìn)一步傳播以及加快疫苗研發(fā)等都是至關(guān)重要的,特別是對(duì)那些跨越宿主障礙的動(dòng)物源性傳染病來(lái)說(shuō)。例如目前已為人熟知艾滋病病毒(HIV-1) [1]、非典型性肺炎病毒(SARS)[2]以及中東呼吸綜合征冠狀病毒(MERS)[3]等均是典型的例子。然而,揭示一種新的人類病原體的來(lái)源需要廣泛而有力的科學(xué)證據(jù),這是一個(gè)非常復(fù)雜的過(guò)程,往往耗時(shí)經(jīng)年,不幸的是,在確認(rèn)新病原體的真正來(lái)源之前,總有些陰謀論搶先浮出水面,稱新病原體是人為制造的。然而歷史終將給出答案,陰謀論終將被科學(xué)推翻。
2019年12月,中國(guó)首次報(bào)道了一種新型致病性冠狀病毒,這一病毒迅速擴(kuò)散到25個(gè)國(guó)家。目前,它已經(jīng)感染了45000多人,并已造成了1000多人死亡(http://2019ncov.Chinacdc.Cn/2019-Ncov)??茖W(xué)家們僅用了兩周左右的時(shí)間就完成了這種新病毒基因組的測(cè)序工作,并于1月12日公布了結(jié)果[4]。1月13日,世界衛(wèi)生組織(WHO) 將這種新的病毒暫命名為2019-nCoV。進(jìn)化分析顯示2019-nCoV是冠狀病毒的新成員,能夠感染人類?;蚍治霰砻?019-nCoV與冠狀病毒同源,但它不同于引起非典(SARS)和中東呼吸綜合征(MERS)的冠狀病毒[5, 6],而是與2013年從云南蝙蝠身上分離到的蝙蝠冠狀病毒RaTG13具有高度的遺傳相似性 (96.3%) ,這表明類RaTG13病毒很可能是當(dāng)前2019-nCoV的源頭,但并非直接來(lái)源[7]。
由于暫時(shí)無(wú)法獲知2019-nCoV的確切來(lái)源,人們開始猜測(cè)2019-nCoV可能來(lái)源于人為的基因改造,甚至有人認(rèn)為這可能是一種生物武器。對(duì)此,媒體紛紛出來(lái)辟謠。然而,最近的一項(xiàng)發(fā)表在預(yù)印本上的非正式的研究報(bào)告表明,與其他冠狀病毒相比,在2019-nCoV的刺突糖蛋白中有四個(gè)插入片段,而刺突糖蛋白正是病毒進(jìn)入靶細(xì)胞的關(guān)鍵蛋白[8]。該研究聲稱,這些插入片段與來(lái)自三個(gè)不同國(guó)家 (泰國(guó)、肯尼亞和印度) 的某些獨(dú)特HIV-1毒株的囊膜糖蛋白或Gag蛋白中高度可變 (V)區(qū) (V1、V4和V5) 的基因序列相同或相似。結(jié)合蛋白結(jié)構(gòu)模型分析,作者推測(cè)這些與HIV-1蛋白相似的插入片段可以增強(qiáng)病毒對(duì)宿主細(xì)胞上特異性受體的親和力,并擴(kuò)大2019-nCoV宿主細(xì)胞的范圍。這項(xiàng)研究暗示2019-nCoV病毒可能是通過(guò)從HIV-1基因組獲得特定基因片段而人為產(chǎn)生的。
我們將2019-nCoV病毒、其他冠狀病毒和HIV-1病毒的序列與GenBank數(shù)據(jù)庫(kù)的序列進(jìn)行了仔細(xì)的比對(duì),并沒(méi)有發(fā)現(xiàn)這四個(gè)插入片段是HIV-1所特有的,亦或是2019-nCoV病毒從HIV-1獲得了這些插入片段的證據(jù)。首先,在GenBank數(shù)據(jù)庫(kù)中對(duì)這些病毒基因進(jìn)行序列比對(duì)的結(jié)果表明,前100個(gè)相同或高度同源的序列均來(lái)自哺乳動(dòng)物的宿主基因、昆蟲、細(xì)菌等 (表1) 。比對(duì)結(jié)果只有幾個(gè)顯示與冠狀病毒同源,但它們均與HIV-1病毒無(wú)關(guān)。病毒序列數(shù)據(jù)庫(kù)的比對(duì)結(jié)果還顯示,這些序列廣泛地存在于從噬菌體、流感到巨型真核病毒等不同類型的病毒中 (表1) 。這些結(jié)果清楚地表明,插入的基因序列廣泛存在于包括病毒在內(nèi)的各種生物體中,絕不是HIV-1所特有的。當(dāng)用2019-nCoV病毒的序列在整個(gè)數(shù)據(jù)庫(kù)中進(jìn)行檢索時(shí),我們發(fā)現(xiàn)它與冠狀病毒的匹配程度更高,僅有少數(shù)與HIV-1相匹配(表1)。并且,雖然有19條記錄顯示插入片段1和2與HIV-1能夠完全匹配,但插入片段3和4與HIV-1的匹配率很低(僅有42%到88%匹配)。另外,插入片段4能夠與HIV-1基因組中的多個(gè)不同基因片段(包括gag、pol和env)進(jìn)行模糊匹配,這表明它們之間的同源性太低(低于42%),因此并不可信。此外,在HIV數(shù)據(jù)庫(kù)中檢索這四個(gè)插入片段,我們也能得到相似的結(jié)論(https://www.hiv.lanl.gov/components/sequence/HIV/search/search.html)。在任何HIV-1中均未發(fā)現(xiàn)與插入片段3和4完全匹配的序列,這也說(shuō)明插入的基因序列廣泛的存在于包括病毒在內(nèi)的各種生物體中,并非HIV-1所特有的。另一方面,HIV-1囊膜蛋白中與之匹配的的區(qū)域都具有高度可變性,常常存在大量的插入和缺失突變,這也表明這些片段對(duì)于HIV-1囊膜糖蛋白的生物學(xué)功能來(lái)說(shuō)并不是必需的。同時(shí),與插入片段1和2完全匹配的序列僅能在少數(shù)的HIV-1病毒株中檢測(cè)到,說(shuō)明在數(shù)以萬(wàn)計(jì)的天然HIV-1中同時(shí)存在這四個(gè)插入突變的序列也是非常罕見(jiàn)甚至并不存在。這也解釋了為什么這四個(gè)插入片段獨(dú)立存在于不同的HIV-1基因組中的原因[8]。由于這些插入片段與HIV-1的同源性低,在HIV-1序列中也非常少見(jiàn),因此我們認(rèn)為HIV-1并非是2019-nCoV基因組中插入序列的來(lái)源。
表1. 4個(gè)插入序列與序列數(shù)據(jù)庫(kù)對(duì)比搜索結(jié)果

其次,這些插入片段不僅存在于2019-nCoV病毒中,還存在于其他三個(gè)源于蝙蝠的β屬冠狀病毒中:包括分離自浙江并于2018年上傳到GenBank數(shù)據(jù)庫(kù)中的ZC45和ZXC21病毒,以及于2013年分離自云南的RaTG13病毒[7]。與ZC45和ZXC21相比,RaTG13與2019-nCoV更為相似(如圖1A所示),它們的刺突蛋白的相似性為97.7%。在RaTG13基因組中,其中兩個(gè)插入片段(HKNNKS和RSYLTPGDSSSSG)與2019-nCoV中的插入片段完全相同,第三個(gè)插入片段僅有一個(gè)絲氨酸(Threonine,T)到異亮氨酸(Isoleucine,I)的替換(TNGIKR),第四個(gè)插入片段的C端缺失4個(gè)氨基酸(QTNS----)(如圖1B所示)。與RaTG13相比,ZC45和ZXC21與2019-nCoV的差異更大,但是這兩種病毒也有與插入片段1、2和3類似的序列(圖 1B)。此外,許多其它的冠狀病毒在插入片段1的位點(diǎn)上都有類似的插入僅序列有些許差異。這些結(jié)果清楚地表明,在2019-nCoV被發(fā)現(xiàn)之前,這四種插入序列中的三種均天然存在于三種蝙蝠的冠狀病毒中。這無(wú)疑駁斥了2019-nCoV可能是通過(guò)人為獲得HIV-1基因組中的一些基因片段而產(chǎn)生的“生化武器”這種觀點(diǎn)。相反,2019-nCoV更可能來(lái)源于類RaTG13的冠狀病毒。
第三,2019-nCoV中的插入片段1和2與某些HIV-1 gp120分離株中的V4和V5區(qū)域具有相同的6個(gè)氨基酸基序,它們?cè)诮Y(jié)構(gòu)上相互接近,由LE loop將二者分隔開(如圖1C所示)[9]。然而,位于2019-nCoV插入片段1和2之間的插入片段3的序列與HIV-1 gp120的V1區(qū)域相似(存在氨基酸的缺失)。V1區(qū)域位于gp120蛋白序列的另一側(cè),離V4和V5區(qū)域較遠(yuǎn),因此它不可能與gp120(圖1C)中的V4/V5區(qū)域具有相互作用。但是在2019-nCoV刺突蛋白的結(jié)構(gòu)模型中,V1區(qū)域恰恰位于V4和V5之間[10]。插入片段4被發(fā)現(xiàn)與HIV-1的Gag蛋白上區(qū)域相同,但這一蛋白與病毒的入侵無(wú)關(guān)。另外,這個(gè)插入位點(diǎn)與其它幾個(gè)位點(diǎn)相距太遠(yuǎn),無(wú)法與2019-nCoV刺突蛋白中的其他三個(gè)插入片段形成同一個(gè)的結(jié)構(gòu)單元(如圖1C所示)。因此,綜上所述,雖然預(yù)印本的作者指出2019-nCoV 從HIV-1中獲得一些結(jié)構(gòu)上看似不相干的部分進(jìn)而產(chǎn)生了一個(gè)獨(dú)特的蛋白結(jié)構(gòu),該結(jié)構(gòu)有利于增強(qiáng)刺突蛋白與受體的結(jié)合能力,但是我們并不認(rèn)為這種結(jié)構(gòu)有任何選擇優(yōu)勢(shì)或理論根據(jù)[8]。

這三個(gè)蝙蝠冠狀病毒株如何獲得這些插入片段目前尚不得而知。對(duì)于病毒而言,若要從其他生物體獲得額外的插入序列,通常需要它與其他生物體有直接的相互作用,通過(guò)同源或非同源重組的方式獲得插入序列[11]。因此只有當(dāng)兩種病毒共同感染同一個(gè)細(xì)胞時(shí),蝙蝠冠狀病毒才可能從HIV-1獲得基因片段。由于蝙蝠冠狀病毒和HIV-1的宿主細(xì)胞不同,因此兩者交換遺傳物質(zhì)的機(jī)會(huì)幾乎可以忽略不計(jì)。但由于這些基序廣泛存在于各種哺乳動(dòng)物細(xì)胞中,因此蝙蝠冠狀病毒更有可能從它們感染細(xì)胞的基因組中獲得這些基序并進(jìn)行重組。想要回答這一問(wèn)題,科研人員應(yīng)該對(duì)野生動(dòng)物和家畜中的冠狀病毒進(jìn)行更廣泛的研究。
鑒定這三種蝙蝠冠狀病毒和最近流行的2019-nCoV毒株中的插入片段的來(lái)源對(duì)我們理解冠狀病毒如何突破宿主障礙,由感染動(dòng)物跨越至感染人類、適應(yīng)人類這些過(guò)程至關(guān)重要。目前的數(shù)據(jù)表明,RaTG13與2019-nCoV的關(guān)系最為密切[7]。但由于它們之間的遺傳差異太大,因此RaTG13并不能作為2019-nCoV的直系祖先。其他與2019-nCoV關(guān)系更為密切的病毒,例如以果子貍為中間宿主的SARS和以駱駝為中間宿主的MERS[3, 12],是否為其直接來(lái)源仍有待研究。人們需要更多的研究以確定2019-nCoV的真正來(lái)源。但病毒的溯源需要對(duì)各種野生動(dòng)物和家畜進(jìn)行篩選,這一過(guò)程可能需要很長(zhǎng)時(shí)間。因此無(wú)論如何,減少或避免與野生動(dòng)物的直接接觸,對(duì)防控未來(lái)可能產(chǎn)生的新型流行性感染病依然至關(guān)重要。
得益于生物信息學(xué)分析工具的快速發(fā)展,現(xiàn)在大家都能夠?qū)π滦蛄羞M(jìn)行廣泛快速的分析。我們必須進(jìn)行全面透徹的分析才能充分理解新的基因組信息隱含的真正生物學(xué)意義。那些有偏見(jiàn)的、片面的以及不正確的分析所得的結(jié)論則會(huì)助長(zhǎng)陰謀論,阻擋科學(xué)發(fā)現(xiàn)的進(jìn)程,極大的影響公眾衛(wèi)生的防控工作。