新冠病毒自爆發以來,由於其溯源工作受到了眾所周知的困難,因此也給了不少陰謀論以滋生的土壤。諸如「新冠病毒是整合了HIV形成的」啦、「新冠病毒是人工合成的」的啦等等,不一而足。在我之前的公眾號文章中都有對這些謠言的剖析和說明。
當然,謠言總是如蘑菇一般裹挾着裹挾着某些人的意志,改頭換面再次滋生出來。比如這兩天又有一個「爆炸性」的「新聞」出現:新冠病毒是國際疫苗巨頭、美國莫德納公司製造出來的!美帝生產疫苗的廠家先釋放病毒,自己再製作販賣疫苗賺大錢,怎麼聽着那麼滿滿具有動機呢?頭腦內立馬腦補一萬字小作文的幹活!
網絡傳言
但是,事實真的如此麼?
這條微博引用的報道是英國的THE EXPOSE,原文鏈接:https://dailyexpose.uk/2022/03/03/evidence-confirms-moderna-created-covid-19/。這個媒體的評價不是我討論的內容,不過各位可以搜索下這個媒體的口碑。原文很長,後面大段是十分聳人聽聞(且情節跌宕起伏)的類似故事會的描述(比如引用聖經的內容來印證「病毒通過武漢軍運會進行傳播」)。
THE EXPOSE中引用聖經內容作為新冠病毒傳播的理由
真正有點乾貨的前半段,其內容主要是解釋了一篇論文《MSH3 Homology and Potential Recombination Link to SARS-CoV-2 Furin Cleavage Site》。該論文於2022年2月發表於《Frontiers in Virology》上。很遺憾的是,我沒有找到這個期刊的影響因子。
那麼我們來分析這篇論文。這篇論文提出了三個觀點:
1、編碼新冠病毒特有的furin酶切位點(FCS)的核酸序列十分罕見。
2、編碼這一段由19個鹼基組成的FCS的核酸序列存在於莫德納公司2006年申請的一個專利中記錄的蛋白序列中。
3、這段19nt序列自發的出現在蛋白編碼序列中的概率極低。
因此得出的結論是:新冠病毒中的這段序列是從莫納德的這個蛋白編碼序列中重組獲得的。
那麼,我們來看看這三個觀點是否站得住腳。
在論文中,作者明確指出:這一段19nt的序列在BLAST數據庫中很少見。
BLAST是人人可以做的。二話不說,打開NCBI,直接將序列貼進去做BLAST。結果呢?嗯,如圖:
使用19nt序列進行blastn的結果,結果有上百個
咦,怎麼和論文說的不一樣?包含這一段19nt鹼基序列的基因序列不要太多啊。在給出的結果中,前面幾個是人工構建的用於研究的新冠病毒ORF1ab序列,包含FCS序列是自然而然的事情,但是還有其他很多和新冠病毒無關的序列,也完美存在這一19nt序列。
有些物種還包括不止一段這19nt(包括核心12nt)序列。例如圖中所示的Amycolatopsis(擬無枝酸菌)就有好幾段此種序列。
擬無枝酸菌也有完美匹配19nt序列,這樣的例子還有很多
事實上,furin酶切位點是一個十分常見的蛋白酶酶切位點,是翻譯後蛋白質成熟修飾的一個步驟,具有一定的生物學功能,因此很多真核生物的多種蛋白質都具有這一位點。其核心氨基酸殘基就4個,對應12個核苷酸,加上頭尾19nt的長度要命中很容易。因此說,所謂「這段序列很罕見」,本質源於作者有意或無意的錯誤BLAST。
此外,考慮到FCS是蛋白質序列,而用於比對的是其編碼的核心序列,因此在一些並不存在FCS的蛋白質的編碼基因中,由於讀碼框錯位,同樣會存在一樣的19nt序列,只不過它並不生成FCS而已。如此高的出現概率,那麼出現在一些申請專利的蛋白質編碼序列中也並不難理解。
讀碼框錯位可以獲得完全不同的蛋白質序列,同樣是CUCCUCGGCGGGCACGUAG,只有在正向的Frame3下才能翻譯得到PRRA的FCS
我們回過頭來看看論文作者如寶貝一般命中的那個莫德納專利文件。該專利編號US-9587003-B2,隨便一個搜索網站都能搜到原文(鏈接:https://pubchem.ncbi.nlm.nih.gov/patent/US-9587003-B2 )。專利文件很長,標題很明確:用於生產腫瘤相關蛋白和多肽的修飾多核苷酸。
這個申請其實是一個比較典型的用於原料保護的文件。也就是說,莫德納公司研發出了很多能夠用來表達腫瘤相關蛋白的核酸,為了生產效率、便於研究等目的對這些核酸進行了一定的修飾,而不是原始核酸,這就凝結了研發人員的勞動,因此需要用專利進行保護。
論文中BLAST命中的這個蛋白質,就是專利中提到的一個蛋白:MSH3(人MutS同源蛋白3)。這個蛋白家族成員具有DNA修復功能,據研究報道還具有介導淋巴細胞對腫瘤細胞進行殺傷的功能,因此被作為研究對象很正常。
序列號11625
事實上,通過對比還可以看到,莫德納公司的這個MSH3蛋白序列,本身並不存在FCS,因為那段FCS的序列在其反向互補片段上。
那麼綜合上面的信息我們可以知道,這篇論文的作者拿了一個來自新冠病毒的FCS序列去(錯誤的)BLAST一下,命中了一個莫德納公司申請專利的蛋白的編碼序列(的反向互補序列),然後就宣稱新冠病毒的這段序列來自於莫德納。
還可以這麼玩?我心裡奔過一萬頭羊駝。
當然,論文作者為了進一步暗示「新冠病毒的FCS來自於莫德納的序列」,還進行了一番數學計算,來論證「這段19nt序列自發的出現在蛋白編碼序列中的概率極低。」
論文的fig2,求數學好的好好解釋下
實話實說,我研究了半天,沒看出來他們這個算法具有什麼生物學意義。例如,P1的解釋是「19個核苷酸的序列出現在30000nt長的基因組」的概率。1/4的19次方很好理解,19nt的序列隨機組合出現一個確定序列的概率,但是乘以30000-18就很難理解了,是想說這19nt序列可在29982個鹼基中插入的位置麼?總之,生物學意義不明,最後算出的3.21×10-11同樣意義不明——沒有這麼算的。
但搞笑的一點是,3.21×10-11算下來是三千二百一十億分之一,結果THE EXPOSE的報道以及國內自媒體轉的都成了「三萬億(3 trillion)分之一」。嗯,就是這麼回事。
千億變萬億
但事實上,從上面的描述,以及生物學過程可以看到,FCS序列,以及和其相似的序列,其實廣泛存在於自然界的生物體中,而更重要的是,FCS具有生物學功能,因此會選擇被固定下來,進而隨着生物的繁殖而擴展,這就是FCS多見的原因。文章的作者假定這段序列為隨機產生、並隨機插入MSH3中,得到了一個極小的概率(並且這個概率的計算方式問題很大),就認為這段序列是人工產生的,這就好比因為人的眼睛是由細緻的結構精密組合起來,總體隨機形成概率很小,就認為眼睛就是人工製造的一樣。這是生物學中的典型謬誤。
綜上,我們可以得出結論:
1、無論是BLAST結果,還是已有的生物學研究都表明,FCS廣泛存在於生物界中,並且新冠病毒中的19nt序列(核心12nt)序列同樣存在於生物界中。
2、錯誤的BLAST命中了莫德納公專利的MSH3序列,這屬於先開槍再畫靶子。
3、概率計算方式並無意義。
因此,這篇「論文」的三個基礎點是完全不牢靠的,那麼基於這篇論文的結論也可想而知。
病毒起源是一個科學問題,而且在紛繁的當下,更要腳踏實地的做好每一步工作,這不僅是對我們負責,更是對後代的負責——只有科學明晰的來源,才能更好的防控疫情,以及應對可能發生的新的疫情。而付諸謠言和陰謀論,最終只能加大裂痕,並讓自身更為盲目。更不要提目前有效的疫苗是對抗疫情,以及在可預見的未來儘可能恢復正常生產生活最為有效的途徑。如此妖魔化疫苗,受害的還將是自己。這樣的教訓,已經很多了。
—————————————分割線——————————————
我還注意到,這篇文章的編輯和審稿人都是中國人。確切的說,是中國農業科學院、哈爾濱獸醫研究所、牛羊傳染病創新團隊的尹鑫研究員和常繼濤副研究員。其實我很想詢問二位如何看待自己作為編輯和審稿人的文章。當然,這個課題組研究的課題,要是套用一些人的邏輯,估計也會成為「中國研發生物wq」的「理由吧~
本文由《看新聞網》原創、編譯、首發或轉載。轉載必須保持文本完整,聲明文章出自看新聞網或原作者,並包含原文標題及鏈接。
本文網址:https://vct.news/zh-hant/news/%e8%8e%ab%e5%be%b7%e7%ba%b3%e5%88%b6%e9%80%a0%e4%ba%86%e6%96%b0%e5%86%a0%e7%97%85%e6%af%92%ef%bc%9f%e5%af%b9%e4%b8%8d%e8%b5%b7%ef%bc%8c%e4%bd%a0%e5%8f%92%e8%a2%ab%e5%bf%bd%e6%82%a0%e4%ba%86%e3%80%82
評論被關閉。