垃圾DNA?
探索非編碼基因的遺傳密碼,
解讀基因組中“暗物質(zhì)”存在的意義!
數(shù)十年來,我們基因組里有98%的DNA因?yàn)闆]有編碼蛋白質(zhì)而被稱為“垃圾”。直到最近,這些垃圾區(qū)域重要且顯著的功能才開始為人們所了解。
從罕見的遺傳疾病到唐氏綜合征,從常見的病毒感染到衰老過程——還沒算上六個(gè)指頭的貓(以及人類中的同癥狀者)——由基因組中暗物質(zhì)導(dǎo)致的影響是常見、多樣和本質(zhì)性的。
科學(xué)家們在這個(gè)備受爭議的領(lǐng)域中快速增長的知識已經(jīng)提供了治療失明的成功療法,并挽救了被DNA指紋宣判了死刑的無辜的人,而且很可能帶來對包括肥胖在內(nèi)的很多醫(yī)學(xué)疾病的治療方法的革命。
在內(nèi)莎?凱里,也是暢銷書《遺傳的革命》的作者看來,這是一本面對大眾讀者的一個(gè)可能會奠定人體復(fù)雜性觀念的圖書。
《垃圾DNA》對非編碼基因作了深入介紹。展示了科學(xué)家們在學(xué)術(shù)領(lǐng)域逐漸發(fā)現(xiàn)的證據(jù),提示這些所謂的“垃圾DNA”的變異和調(diào)節(jié)與一些難治性疾病有關(guān)。并用不可辯駁的證據(jù)證明了“垃圾DNA”在基因的表達(dá)調(diào)控中起著重要且不可預(yù)料的作用,其作用覆蓋從單個(gè)基因的微調(diào)到整個(gè)染色體的關(guān)閉。這些功能迫使科學(xué)家們重新審視關(guān)于“基因”的定義。
《垃圾DNA》是內(nèi)莎?凱里續(xù)《遺傳的革命》出版之后又一部具有高學(xué)術(shù)性的相關(guān)遺傳學(xué)經(jīng)典力作。作者以令人信服的筆觸為讀者全面介紹了“垃圾DNA”的涵義,及其與遺傳性疾病、病毒感染、哺乳動物性別決定和生命進(jìn)化的關(guān)系。閱讀本書,我們可以緊跟科學(xué)家的腳步迅速進(jìn)入“垃圾DNA”的領(lǐng)域。而這個(gè)具有快速發(fā)展的且頗受爭議的領(lǐng)域,還有廣袤的未知在等著我們?nèi)ラ_發(fā)與探索。
作者序
其實(shí)寫一本關(guān)于垃圾DNA的書還是有些困難的,因?yàn)樗暮x一直都在不斷地演變。有部分原因是新的數(shù)據(jù)會不停地改變我們的舊有觀念,結(jié)果就是,只要一個(gè)垃圾DNA被證明事實(shí)上具有一定的功能,有些科學(xué)家就會說(在邏輯上完全正確)它不再是垃圾。但使用這種方法有可能掩蓋掉這些年來我們對基因組的理解產(chǎn)生了何等翻天覆地變化的過程。
與其花時(shí)間在這里糾纏不清,我決定采取一個(gè)快刀斬亂麻的方法,使用一個(gè)簡單粗暴的定義。把任何不能編碼蛋白的序列都定義為垃圾,如同它在過去最初的定義一般(20世紀(jì)下半葉)。純粹主義者會尖叫抗議,但就這樣決定了。問3個(gè)不同的科學(xué)家什么是“垃圾”DNA,我們可能會得到4個(gè)不同的答案。因此,在開始的時(shí)候就簡單一點(diǎn)利大于弊。
同樣,我使用“基因”這個(gè)詞來描述編碼蛋白的那些DNA序列。這個(gè)定義會貫穿本書的始終。
在我的第一本書《遺傳的革命》出版后,我意識到不同的讀者對基因名稱的需求差異很大。有些人喜歡知道我們正在討論的是哪個(gè)基因,但對于其他讀者而言,這或許會干擾閱讀的流暢性。所以這次,我只在絕對必要的情況下才使用具體的基因名稱。
對基因組暗物質(zhì)的介紹
想象一下現(xiàn)在你手里有一個(gè)戲劇、一部電影、一部電視節(jié)目的劇本。當(dāng)然,完全可能有人僅僅把劇本當(dāng)成一本書來看。但是,如果它被用來產(chǎn)生某些東西的時(shí)候,它會變得更有力量。在被大聲朗讀出來,甚至被表演出來時(shí),它就不再僅是頁面上的一串字符而已了。
DNA就是如此,它是最杰出的劇本。僅使用4個(gè)簡單的字母,它就攜帶了生命的所有編碼,從細(xì)菌到大象、從啤酒酵母到藍(lán)鯨。但試管中的DNA是很無聊的,它完全沒有用處。而細(xì)胞或動物開始用它進(jìn)行生產(chǎn)的時(shí)候,DNA就會變得令人興奮。DNA被作為制造蛋白的編碼,這些蛋白對呼吸、進(jìn)食、排泄廢物、生殖和所有其他生命特有的活動都至關(guān)重要。
蛋白的功能是如此重要,以至于20世紀(jì)的科學(xué)家使用它們來界定基因的含義。基因就是能夠編碼蛋白的DNA序列。
讓我們來懷念一下歷史上最偉大的劇作家威廉姆.莎士比亞(William Shakespeare)。我們可能需要一段時(shí)間才能理解莎士比亞的著作,因?yàn)橛⒄Z從他去世的那個(gè)世紀(jì)起已發(fā)生了不小的改變。但即使如此,我們?nèi)匀幌嘈,詩人僅書寫了他需要演員說的那些話。
例如,莎士比亞不會像下面這么寫劇本:
事實(shí)上,他只寫了劃線部分的單詞:
就是“A rose by any other name would smell as sweet(即使給玫瑰換個(gè)稱謂,它依然芳香如故)”。
但如果看看我們自己的DNA劇本,它并不像莎士比亞那些劃了線的詞語那么清晰和緊湊。相反,每個(gè)編碼蛋白的區(qū)域就像是漂浮在“廢話海洋”上的一個(gè)詞。
多年來,科學(xué)家們并不能解釋為什么那么多的DNA不編碼蛋白。這些非編碼的部分被誤會成“垃圾DNA”。但漸漸的,這個(gè)看法已經(jīng)被一大堆理由逼迫得站不住腳了。
也許,轉(zhuǎn)變該觀點(diǎn)最根本的原因是源于我們細(xì)胞中垃圾DNA那驚人的總量。其中一個(gè)最大的沖擊來自2001年人類基因組測序完成的時(shí)候,人們發(fā)現(xiàn)人類細(xì)胞中98%以上的DNA被劃入了垃圾的行列。它不編碼任何蛋白。上面使用的莎士比亞的比喻實(shí)際上是一個(gè)精簡了的模型。在基因組里,亂七八糟的文字的比例約為前面提到的亂序劇本的4倍。每一個(gè)有意義的字母都對應(yīng)著超過50個(gè)字母的垃圾文字。
還有一個(gè)類似的比喻。請想象下我們?nèi)⒂^一個(gè)汽車廠,這家汽車廠也許像法拉利那么高端。如果我們看到只需要兩個(gè)人就能造好一輛炫酷的紅色跑車,而同時(shí)又有98個(gè)人在一旁無所事事的話一定很驚訝。這顯然是荒謬的,那么為什么這在我們的基因組里是合理存在的?當(dāng)然,你可以說從共同祖先進(jìn)化而來的生物往往不是完美的——比如我們?nèi)祟惥痛_實(shí)不需要闌尾(本書中作者多次以闌尾為例說明人體確實(shí)存在一些無功能的器官,但此觀點(diǎn)尚存爭議,因?yàn)橛醒芯空哒J(rèn)為闌尾在免疫和消化方面仍具有一定的功能。)——但這次似乎不完美得有點(diǎn)過頭了。
事實(shí)上,在我們的汽車廠里,更可能的情況應(yīng)該是,由兩個(gè)人組裝一輛汽車,其他的98個(gè)人做著其他一切使這家企業(yè)運(yùn)轉(zhuǎn)的工作。融資、記帳、宣傳產(chǎn)品、處理養(yǎng)老金、打掃廁所和汽車銷售等,這可能是一個(gè)更好的垃圾DNA在我們基因組里工作的模式。我們可以把蛋白作為生命所需的最終物質(zhì),但如果沒有垃圾DNA的話,它們永遠(yuǎn)不會被正確地生產(chǎn)和整合出來。確實(shí),兩人就能制造汽車,但他們不能保證公司可以出售汽車,也不能把它變成一個(gè)強(qiáng)大且成功的品牌。同樣,如果沒有汽車被生產(chǎn)出來,就算有98個(gè)員工在展廳拖地板和磨破嘴皮子也沒有任何意義。只有每個(gè)組件各司其職的時(shí)候整個(gè)組織才能運(yùn)轉(zhuǎn)。而這,就是我們基因組的模式。
另一個(gè)來自基因組測序的令人震驚的事實(shí)是,使用經(jīng)典的基因模型無法解釋人類極其復(fù)雜的解剖結(jié)構(gòu)、生理功能、智力和行為。在編碼蛋白的基因的數(shù)量上,人體跟簡單而微小的蠕蟲幾乎具有相同的數(shù)量(大約20 000個(gè))。更值得注意的是,大部分蠕蟲的基因跟人類基因可以直接等效。
當(dāng)研究人員想在DNA水平上深入分析人類與其他生物到底有什么區(qū)別的時(shí)候,很明顯,基因不能提供解釋。事實(shí)上,遺傳物質(zhì)只有一個(gè)特征與復(fù)雜性相關(guān)。這個(gè)唯一的隨著動物復(fù)雜性增加而增加的就是垃圾DNA區(qū)域。一個(gè)生命體越復(fù)雜,垃圾DNA所占的百分比就越高。只有現(xiàn)在,科學(xué)家們才真正開始關(guān)注這個(gè)有爭議的觀點(diǎn),就是垃圾DNA可能是進(jìn)化復(fù)雜性的關(guān)鍵。
從某個(gè)角度看,這些數(shù)據(jù)所引出的問題是很明顯的。如果垃圾DNA是如此的重要,那它到底是干什么的?如果不編碼蛋白,它在細(xì)胞中的作用是什么?現(xiàn)在人們逐漸接受了垃圾DNA其實(shí)具有多種不同功能的觀點(diǎn),所以對下面的敘述我們并不會感到吃驚。
它們中的一些在染色體(我們的DNA被打包成的巨大分子)中形成特殊的結(jié)構(gòu)。這種垃圾DNA保護(hù)我們的DNA不被解體和受損。隨著我們年齡的增長,這些區(qū)域不斷縮小,最后縮小到臨界程度。之后,我們的遺傳物質(zhì)就變得很容易遭遇潛在的災(zāi)難性的重排,從而導(dǎo)致細(xì)胞的死亡或癌變。其他結(jié)構(gòu)類型的垃圾DNA在細(xì)胞分裂成子細(xì)胞過程中進(jìn)行染色體均分時(shí)作為錨點(diǎn)。(“子細(xì)胞”是指由親代細(xì)胞分裂產(chǎn)生的細(xì)胞。)其他的則作為絕緣結(jié)構(gòu),限制了特定區(qū)域染色體的基因表達(dá)。
但是我們很多的垃圾DNA并不僅僅具有上面提到的功能。它確實(shí)不編碼蛋白質(zhì),但它卻編碼另外一種分子,我們稱之為RNA。垃圾DNA里面有很大一類在細(xì)胞內(nèi)建造工廠,來幫助蛋白質(zhì)的合成。其他類型的RNA分子負(fù)責(zé)將制造蛋白質(zhì)所需的原料轉(zhuǎn)移到工廠里面。
另外有些垃圾DNA是來自病毒和其他微生物的遺傳物質(zhì)的入侵,它們已經(jīng)如遺傳間諜般融入了人類染色體中。這些早已死去的生物的殘留物對細(xì)胞有著潛在的危險(xiǎn),有些在個(gè)體中,而有的甚至存在于廣泛的人群中。哺乳動物細(xì)胞已進(jìn)化出多種機(jī)制來使這些病毒元件保持沉默,但有的時(shí)候這些系統(tǒng)可以被打破。當(dāng)出現(xiàn)這種問題的時(shí)候,它們所產(chǎn)生的影響可以是相對良性的,比如特定種系小鼠毛色的改變,也可以是很嚴(yán)重的,比如增加罹患癌癥的風(fēng)險(xiǎn)。
就在前幾年,人們認(rèn)識到垃圾DNA的一個(gè)主要作用其實(shí)是調(diào)節(jié)基因的表達(dá)。有時(shí)候,它在個(gè)體上會有巨大的、明顯的效果。比如,一個(gè)垃圾DNA就可以決定雌性動物能否保持正確的基因表達(dá)模式。它的作用也可以是在群體中的,一個(gè)最常見的例子是虎斑貓顏色特征的控制。在極端的例子中,該機(jī)制也能解釋為什么有同樣遺傳性疾病的同卵雙胞胎女性會出現(xiàn)截然不同的癥狀。在某些情況下,情況可以極端到雙胞胎中的一個(gè)罹患了嚴(yán)重危及生命的疾病,而另一個(gè)則是完全健康的。
成千上萬的垃圾DNA片段被認(rèn)為參與了調(diào)控基因表達(dá)的網(wǎng)絡(luò)。它們就像是遺傳劇本的舞臺導(dǎo)演一樣,只是其指導(dǎo)對象的復(fù)雜性是我們在劇院里無法想象的。它絕對不是“出去,被熊追趕”那么簡單。而應(yīng)該是類似于“如果在溫哥華和珀斯的暴風(fēng)雨中表演《哈姆雷特》,就應(yīng)該重讀《麥克白》這一行的第四音節(jié)。除非有個(gè)業(yè)余演員在蒙巴薩表演《理查三世》而且基多在下雨!
研究人員剛剛才開始揭開垃圾DNA龐大網(wǎng)絡(luò)中的奧秘和關(guān)聯(lián)的一角。這個(gè)領(lǐng)域仍極具爭議。在極端的情況下,有科學(xué)家聲稱有些武斷的說法嚴(yán)重缺乏實(shí)驗(yàn)證據(jù)的支持。其他有些人則覺得有整整一代科學(xué)家(甚至更多)被困在一個(gè)過時(shí)的模型中而無法看到或者理解這個(gè)新領(lǐng)域。
有部分原因是,我們可以用來探索垃圾DNA功能的手段還比較落后。這有時(shí)會讓研究人員很難使用實(shí)驗(yàn)來檢驗(yàn)他們的假設(shè)。確實(shí),我們對該領(lǐng)域的研究時(shí)間還相對較短。但有時(shí)候,我們可以從實(shí)驗(yàn)室的板凳跟機(jī)器旁退出來,去草坪轉(zhuǎn)轉(zhuǎn)。實(shí)驗(yàn)每天都在我們身邊發(fā)生,因?yàn)樽匀缓瓦M(jìn)化已經(jīng)使用了幾十億年的時(shí)間來嘗試各種變化。即使僅僅在我們這個(gè)物種出現(xiàn)和繁衍的時(shí)間段,也已經(jīng)有足夠的時(shí)間來進(jìn)行大規(guī)模的實(shí)驗(yàn)測試。因此,我們將在本書中利用人類遺傳學(xué)的火炬來探索黑暗。
可以有許多方法來開始我們的探究基因組暗物質(zhì)之旅,這里,讓我們用一個(gè)有些奇怪但不容置疑的事實(shí)來開始。一些遺傳病是由垃圾DNA的突變引起的,這應(yīng)該是我們進(jìn)入隱藏的基因組宇宙的最好起點(diǎn)。