·“研究靈長類演化的過程和與近緣物種的基因組比較可以告訴我們哪些DNA序列是真正人類特異的,這些人類特異的DNA序列往往對(duì)人類獨(dú)特性狀的出現(xiàn)和正常發(fā)育發(fā)揮了重要作用。另一方面,我們還可以知道哪些DNA序列是人類和其他物種共有的,甚至在長期的演化過程中幾乎沒有發(fā)生任何變化,而這些序列一旦在現(xiàn)代人里出現(xiàn)變異,往往會(huì)導(dǎo)致疾病或者不良表型?!?/p>
非人靈長類動(dòng)物是人類的“近親”,你可能會(huì)立刻想到各種猴子,但靈長類動(dòng)物的范疇遠(yuǎn)不止于此。靈長目(Primates)是哺乳綱下的一個(gè)目,分為2個(gè)亞目——原猴亞目和簡鼻亞目,共有16科79個(gè)屬種,500余個(gè)物種。人類也是其中一員。
靈長目演化樹。圖片由Stephen D. Nash繪制,張國捷課題組和吳東東課題組合作供圖
研究非人靈長類動(dòng)物起源和演化可以為揭示人類的起源,以及人類何以形成獨(dú)特的身體結(jié)構(gòu)特征提供線索。
當(dāng)?shù)貢r(shí)間6月1日,由中國科學(xué)家組織的靈長類基因組計(jì)劃發(fā)布階段性成果,共計(jì)8篇論文,以研究??男问桨l(fā)表于《科學(xué)》(Science)雜志,其中4篇為該計(jì)劃產(chǎn)生的主要論文,另外4篇為該計(jì)劃擴(kuò)展的國際靈長類研究聯(lián)盟產(chǎn)生的論文。此外還有3篇論文已經(jīng)或即將在《科學(xué)進(jìn)展》(Science Advances)、《自然-生態(tài)與演化》(Nature Ecology & Evolution)等知名學(xué)術(shù)期刊發(fā)表。
這些論文探討了靈長類物種的起源和分化過程、靈長類社會(huì)行為和社會(huì)組織的起源,以及大腦等各種生理特征的演化和遺傳基礎(chǔ)。
據(jù)《科學(xué)》雜志的??喗榻榻B,“60%的靈長類動(dòng)物面臨滅絕威脅,通過這次表征其基因組的努力,希望可以為保護(hù)人類和其他靈長類成員提供更多理解?!?/p>
新增27個(gè)高質(zhì)量靈長類基因組數(shù)據(jù)
該計(jì)劃的旗艦論文題為《基因組學(xué)分析提供了對(duì)靈長類演化的洞見》(Phylogenomic yses provide insights into primate evolution),由浙江大學(xué)生命演化研究中心張國捷教授團(tuán)隊(duì)、昆明動(dòng)物研究所吳東東教授團(tuán)隊(duì)、西北大學(xué)齊曉光教授團(tuán)隊(duì)和其他國內(nèi)外合作者共同完成。
“我們利用第三代基因測序技術(shù),獲取了27個(gè)新的高質(zhì)量靈長類基因組數(shù)據(jù),加上過去已經(jīng)發(fā)表的23個(gè)靈長類基因組數(shù)據(jù),這次的研究共包括50個(gè)靈長類動(dòng)物的基因組數(shù)據(jù),覆蓋了絕大部分科的物種,尤其是在一些演化的關(guān)鍵節(jié)點(diǎn)上。”5月26日,張國捷課題組成員之一周龍向澎湃科技介紹。
結(jié)合基因組數(shù)據(jù)和化石時(shí)間數(shù)據(jù)進(jìn)行分析,研究人員推斷出了靈長類動(dòng)物各主要類群的演化時(shí)間,并推斷出所有靈長類的最近共同祖先出現(xiàn)在大約6829萬到95萬年前。這一時(shí)間距離6550萬年前造成非鳥恐龍滅絕的白堊紀(jì)末期大滅絕事件非常近,研究人員認(rèn)為,這意味著靈長類動(dòng)物的演化可能受到物種大滅絕事件的影響。
該研究采用更多染色體級(jí)別的原猴物種進(jìn)行研究,修正了人類8號(hào)染色體起源的假說。舊假說認(rèn)為,人的8號(hào)染色體是繼承自靈長類的祖先某條祖先染色體,這條染色體在新世界猴中發(fā)生了斷裂事件,分化出兩條新的染色體。而該研究發(fā)現(xiàn),人的8號(hào)染色體對(duì)應(yīng)到原猴的兩條染色體上,研究人員據(jù)此推測類人猿下目祖先以及所有靈長類祖先中的兩條染色體在狹鼻類出現(xiàn)后融合成一條染色體,最終演變成人類8號(hào)染色體。
該研究還發(fā)現(xiàn),在靈長類祖先到人的演化歷程中,靈長類的相對(duì)腦容量在四個(gè)關(guān)鍵的演化節(jié)點(diǎn)顯著增大,分別為類人猿下目的祖先、狹鼻類祖先、大猿祖先和人類,這種趨勢(shì)在人類中達(dá)到了頂峰。
在靈長類大腦演化的過程中,研究人員發(fā)現(xiàn),一些基因受到了強(qiáng)烈的正向選擇(在自然界的選擇下,某一位點(diǎn)逐漸積累,成為優(yōu)勢(shì)位點(diǎn)),其中包括一些已經(jīng)被前人的研究證明為大腦發(fā)育關(guān)鍵的基因,如果這些基因紊亂,往往會(huì)導(dǎo)致大腦疾病的產(chǎn)生。例如小頭畸形,一種嚴(yán)重的神經(jīng)系統(tǒng)缺陷,患者的腦容量由于神經(jīng)細(xì)胞增殖能力受阻而變小。與小頭畸形相關(guān)的基因在靈長類演化的多個(gè)分支受到強(qiáng)烈的正向選擇,被認(rèn)為可能在人類腦容量增大中發(fā)揮了作用。
靈長類不同分支跟小頭畸形相關(guān)的受到正選擇的基因列表。張國捷課題組和吳東東課題組合作供圖
“人類的一個(gè)很明顯的特點(diǎn)就是比其他的動(dòng)物聰明,體現(xiàn)在生理構(gòu)造上是大腦容量更大,大腦皮層的褶皺更多,我們的研究把人類比其他動(dòng)物更聰明的原因定位到了基因以及其相關(guān)的調(diào)控區(qū)域上?!敝荦埥榻B。
寒冷氣候驅(qū)動(dòng)靈長類復(fù)雜社會(huì)的形成
人類的社會(huì)分成了家庭、家族、氏族等不同的組織層次,這種復(fù)雜的社會(huì)組織形式被稱為“重層社會(huì)”(multilevel society),這一現(xiàn)象也出現(xiàn)在包括金絲猴、部分葉猴在內(nèi)的亞洲葉猴類中。靈長類的復(fù)雜社會(huì)組織形式是如何形成的?西北大學(xué)齊曉光教授、李保國教授,中國科學(xué)院昆明動(dòng)物所吳東東研究員、澳大利亞西澳大學(xué)(The University of Western Australia)西里爾·格魯特(Cyril C. Grueter)研究員等主導(dǎo)的聯(lián)合研究團(tuán)隊(duì)共同回答了這個(gè)問題,相關(guān)成果以《對(duì)寒冷氣候的適應(yīng)推動(dòng)亞洲葉猴的社會(huì)演化》(Adaptations to a cold climate promoted social evolution in Asian colobine primates)為題發(fā)表于《科學(xué)》雜志。
該研究從亞洲葉猴所有7個(gè)屬中,各挑選出1個(gè)代表性物種,測序并組裝了7個(gè)物種的全基因組,并根據(jù)4992個(gè)直系同源組,結(jié)合最新的化石證據(jù),構(gòu)建了可靠的系統(tǒng)發(fā)育樹,支持亞洲葉猴類在約750萬年前分化為兩支,即經(jīng)典葉猴類和金絲猴等奇鼻猴類,并理順了頗具爭議的屬間關(guān)系。研究人員從系統(tǒng)發(fā)育、生物地理等多角度還原了亞洲葉猴類的演化歷史,提出了亞洲葉猴類從喜馬拉雅山南麓到達(dá)東亞、東南亞地區(qū)的歷史擴(kuò)散路線,挑戰(zhàn)了亞洲葉猴的祖先從北方南下進(jìn)入東亞的觀點(diǎn)。
根據(jù)新的系統(tǒng)發(fā)育樹、擴(kuò)散路線和地質(zhì)變化,研究團(tuán)隊(duì)認(rèn)為寒冷氣候是推動(dòng)亞洲葉猴形成重層社會(huì)的重要因素。進(jìn)一步研究發(fā)現(xiàn),能量代謝和神經(jīng)內(nèi)分泌相關(guān)的基因在發(fā)生了社會(huì)聚合的奇鼻猴類中經(jīng)歷了快速演化。其中,催產(chǎn)素和多巴胺通路的功能與社會(huì)組織的復(fù)雜程度呈正相關(guān)。這些結(jié)果表明,以這兩種神經(jīng)遞質(zhì)為代表的神經(jīng)-內(nèi)分泌系統(tǒng)的重塑很可能是亞洲葉猴形成更大、更穩(wěn)定社會(huì)的生理基礎(chǔ)。
雜交驅(qū)動(dòng)靈長類新物種形成
第三篇論文關(guān)注金絲猴的“身世”,由云南大學(xué)于黎教授聯(lián)合多個(gè)課題組共同完成,題為《黔金絲猴,一種靈長類動(dòng)物的雜交起源》(Hybrid origin of a primate, the gray snub-nosed monkey)。
金絲猴并不都是金色的。在生物分類學(xué)上,金絲猴屬于靈長目猴科下的仰鼻猴屬(Rhinopithecus),一共有5個(gè)物種,分別是川金絲猴(R. roxellana)、滇金絲猴(R. bieti)、黔金絲猴(R. brelichi)、怒江金絲猴(R. strykeri)和越南金絲猴(R. avunculus)。其中,真正渾身金毛的只有中國四川、陜西、甘肅等地的川金絲猴,滇金絲猴黑背白腹怒江金絲猴通體黑色毛發(fā)。而黔金絲猴的毛發(fā)更是特別,它們的頭部與肩膀等處為金色毛發(fā),其他部位則覆蓋深色毛發(fā)。
黔金絲猴獨(dú)特的毛發(fā)是如何形成的?從這一問題出發(fā),研究人員通過比較基因組學(xué)分析發(fā)現(xiàn),黔金絲猴是川金絲猴和滇金絲猴/怒江金絲猴共同祖先雜交后形成的物種,在演化過程中與兩個(gè)祖先物種形成了生殖隔離(指兩個(gè)物種由于地理隔離等各種原因無法進(jìn)行基因的交流,表現(xiàn)為兩個(gè)物種無法交配,交配后無法誕生后代,或后代不可育等),進(jìn)而成為一個(gè)新的獨(dú)立物種。黔金絲猴的毛發(fā)顏色實(shí)際是川、滇以及怒江金絲猴毛色的嵌合體,其毛發(fā)基因有些來源于川金絲猴,有些來源于滇/怒江金絲猴的共同祖先。
“雜交事件很普遍,但物種之間雜交形成全新的物種,在動(dòng)物界比較罕見,在靈長類動(dòng)物中是首次報(bào)道。”周龍對(duì)澎湃科技記者說。
值得一提的是,此次發(fā)表于《科學(xué)進(jìn)展》的研究中也發(fā)現(xiàn)了類似的雜交成種現(xiàn)象:獼猴類中的食蟹猴種組(包含3個(gè)物種)是獅尾猴種組的祖先與斯里蘭卡種組的祖先雜交后形成的新物種類群。同時(shí)國際合作團(tuán)隊(duì)也在《科學(xué)》雜志發(fā)表了《全基因組共祖分析揭示了狒狒古代和近期由雄性驅(qū)動(dòng)的遺傳混合》(Genome-wide coancestry reveals details of ancient and recent male-driven reticulation in baboons)為標(biāo)題的論文,揭示了東非狒狒和黃狒狒之間復(fù)雜的遺傳背景和演化歷史和雄性狒狒離群活動(dòng)而驅(qū)動(dòng)的近緣物種間的基因交流有關(guān)。這表明,雜交是靈長類動(dòng)物物種形成的重要驅(qū)動(dòng)力之一。
不完全譜系分流影響物種分化
和大猩猩相比,人與黑猩猩的親緣關(guān)系更近,但在人的基因組里卻有超過15%的基因組區(qū)域跟大猩猩更相似。這在遺傳學(xué)上被稱為不完全譜系分流(incomplete lineage sorting,ILS),即親緣關(guān)系較遠(yuǎn)的物種之間在某些基因上存在相似性。不完全譜系分流在多個(gè)物種中都已被觀察到過。
不完全譜系分流在多大程度上影響靈長類物種的分化?張國捷團(tuán)隊(duì)與丹麥奧胡斯大學(xué)(Aarhus University)米凱爾·舒爾普(Mikkel H. Schierup)團(tuán)隊(duì)共同合作,利用全基因組數(shù)據(jù)對(duì)29個(gè)靈長類祖先節(jié)點(diǎn)的不完全譜系分流現(xiàn)象進(jìn)行了分析,發(fā)現(xiàn)在靈長類所有演化節(jié)點(diǎn)上,靈長類基因組有5%-%的區(qū)域發(fā)生了不完全譜系分流,表明在靈長類的演化歷程中,不完全譜系分流在某些時(shí)間曾產(chǎn)生了較大的影響。
而且基因組上存在某些區(qū)域,在整個(gè)靈長類的演化過程中一直保持著較高或者較低的不完全譜系分流水平,這反映這些區(qū)域曾面臨不同的選擇壓力。例如與轉(zhuǎn)錄調(diào)節(jié)相關(guān)的看家基因(指所有細(xì)胞中均要穩(wěn)定表達(dá)的一類基因,其產(chǎn)物是維持細(xì)胞基本生命活動(dòng)所必需的)PIAS3,在幾乎29個(gè)祖先節(jié)點(diǎn)都表現(xiàn)出了較低的不完全譜系分流水平,而與免疫相關(guān)的CD1A基因,在整個(gè)演化歷程中都表現(xiàn)出較高的不完全譜系分流水平。
該論文題為《不完全譜系分流在靈長類演化過程中的影響以及其和選擇作用的關(guān)系》(Pervasive incomplete lineage sorting illuminates speciation and selection in primates)。
遺傳多樣性與物種滅絕風(fēng)險(xiǎn)無直接關(guān)聯(lián)
物種滅絕風(fēng)險(xiǎn)是否與遺傳多樣性的喪失相關(guān)是一個(gè)長期被討論的問題?!耙话阏J(rèn)為,物種多樣性越多,物種對(duì)于環(huán)境的適應(yīng)性就越強(qiáng),當(dāng)環(huán)境陡然發(fā)生變化時(shí),物種中就有更多的個(gè)體容易適應(yīng)環(huán)境變化,從而生存下來?!敝荦埾蚺炫瓤萍加浾呓忉?。
西班牙龐培法布拉大學(xué)(Universitat Pompeu Fabra)托馬斯·馬奎斯-博內(nèi)特(Tomàs Marquès-Bonet)教授領(lǐng)銜的多家國際團(tuán)隊(duì),對(duì)來自211個(gè)靈長類動(dòng)物的703個(gè)個(gè)體基因組進(jìn)行了高深度測序。綜合先前發(fā)表的29個(gè)物種共計(jì)106個(gè)個(gè)體數(shù)據(jù),構(gòu)建了目前多樣性最豐富的靈長類物種基因組數(shù)據(jù)集,涵蓋了靈長類動(dòng)物全部的科、86%的屬和47%的物種。這被認(rèn)為是迄今為止最豐富的靈長類物種基因組數(shù)據(jù)集。相關(guān)論文以《來自233種靈長類動(dòng)物的全基因組多樣性全球目錄》(A global catalog of whole-genome diversity from 233 primate species)為題發(fā)表于《科學(xué)》雜志。
研究團(tuán)隊(duì)對(duì)這些來自233種靈長類動(dòng)物的809個(gè)個(gè)體基因組的重測序數(shù)據(jù)進(jìn)行了分析,基于基因組雜合性和連續(xù)性純合片段(RoH)長度的結(jié)果表明,基因組多樣性與世界自然保護(hù)聯(lián)盟劃定的滅絕風(fēng)險(xiǎn)類別之間在整體上沒有直接關(guān)聯(lián)。
這也就說明,靈長類的遺傳多樣性不能完全表征物種的瀕危程度,物種瀕危狀態(tài)的形成很大程度上受到非遺傳因素的威脅?!霸诖舜窝芯恐羞z傳多樣性對(duì)物種滅絕的影響沒有那么大,但是靈長類動(dòng)物的研究結(jié)果不能代表所有物種。不能因此而不關(guān)心遺傳多樣性,它仍然是很重要的?!敝荦堈f。
用靈長類基因組數(shù)據(jù)訓(xùn)練AI,識(shí)別人類致病基因突變
隨著人類基因組計(jì)劃(HGP)的完成及基因測序技術(shù)的發(fā)展,研究人員已經(jīng)揭示了個(gè)體之間大量的基因變異,并找出了許多特定基因的突變與疾病的關(guān)系。然而在人類基因組中,可能導(dǎo)致蛋白質(zhì)改變的基因變異數(shù)量超過了7000萬種,其中僅約0.1%的變異在臨床變異數(shù)據(jù)庫中被注釋,其余變異的臨床意義并不明確。人類基因變異的罕見性使得破譯個(gè)人基因組的進(jìn)展緩慢。
靈長類動(dòng)物與人類的親緣關(guān)系最為接近,例如,黑猩猩和人類的蛋白質(zhì)序列相似度高達(dá)99.4%,這表明在黑猩猩中發(fā)現(xiàn)的蛋白質(zhì)變異很可能在人類中具有同樣或接近的效果。研究人員想到,可以通過對(duì)靈長類動(dòng)物群體的測序研究來系統(tǒng)地分析常見變異,這些常見的變異在靈長類中很可能是無害或者低害的。“某些突變?cè)陟`長類中普遍存在時(shí),我們認(rèn)為它對(duì)人類的致病性可能沒那么強(qiáng)?!敝荦埥忉尅?/p>
基因測序巨頭Illumina人工智能實(shí)驗(yàn)室的首席研究員凱爾·凱-豪·法爾(Kyle Kai-How Farh)領(lǐng)導(dǎo)的聯(lián)合研究團(tuán)隊(duì)基于前述809個(gè)靈長類個(gè)體基因組鑒定出了人類直系同源蛋白上430萬個(gè)可能導(dǎo)致蛋白結(jié)構(gòu)變化的基因變異位點(diǎn),加入人類疾病基因數(shù)據(jù)后,訓(xùn)練了PrimateAI-3D的人工智能神經(jīng)網(wǎng)絡(luò)以識(shí)別和前瞻性地判斷人類可能出現(xiàn)的基因突變并預(yù)測是否可能為良性突變。
相關(guān)論文題為《人類和靈長類群體中可容忍的遺傳變異景觀》(人類和靈長類群體中可容忍的遺傳變異景觀)。
基于PrimateAI-3D人工智能神經(jīng)網(wǎng)絡(luò),該研究團(tuán)隊(duì)還開發(fā)了通過罕見突變預(yù)測人類患病風(fēng)險(xiǎn)的方法,其提出了一種罕見變異的多基因風(fēng)險(xiǎn)評(píng)分(polygenic risk score,PRS)系統(tǒng),并使用UK Biobank的數(shù)據(jù),構(gòu)建了罕見變異PRS模型,可識(shí)別高風(fēng)險(xiǎn)患病個(gè)體。
研究發(fā)現(xiàn)常見變異和罕見變異在預(yù)測人類疾病風(fēng)險(xiǎn)方面具有互補(bǔ)的效用,即常見突變可以平均識(shí)別出更多可能患病的個(gè)體,而罕見變異更容易識(shí)別出最高風(fēng)險(xiǎn)的異常個(gè)體,這對(duì)于預(yù)防性篩查具有重要意義。
相關(guān)論文題為《罕見滲透性突變給常見疾病帶來嚴(yán)重的風(fēng)險(xiǎn)》(Rare penetrant mutations confer severe risk of common diseases)。
研究更廣泛物種基因組,尋找人類特異基因
據(jù)了解,靈長類基因組計(jì)劃由張國捷教授和吳東東研究員于2019年提出和發(fā)起,隨后,西班牙龐培法布拉大學(xué)的托馬斯·馬奎斯-博內(nèi)特(Tomàs Marquès-Bonet)教授在此計(jì)劃基礎(chǔ)上組織了群體遺傳學(xué)研究。
靈長類基因組計(jì)劃的研究聯(lián)盟包括浙江大學(xué)生命演化研究中心張國捷教授團(tuán)隊(duì)、中國科學(xué)院昆明動(dòng)物所吳東東研究員團(tuán)隊(duì)、西北大學(xué)生命科學(xué)學(xué)院齊曉光教授團(tuán)隊(duì)、云南大學(xué)生命科學(xué)學(xué)院于黎研究員團(tuán)隊(duì)、西班牙龐培法布拉大學(xué)聯(lián)合演化生物學(xué)研究所Tomàs Marquès-Bonet教授團(tuán)隊(duì)、Illumina人工智能實(shí)驗(yàn)室、美國貝勒醫(yī)學(xué)院人類基因組測序中心Jeffrey Rogers教授團(tuán)隊(duì)、丹麥奧胡斯大學(xué)Mikkel H. Schierup團(tuán)隊(duì),以及德國萊布尼茨靈長類研究所Christian Roos教授團(tuán)隊(duì)。
張國捷告訴澎湃科技,他們希望通過靈長類基因組計(jì)劃對(duì)不同靈長類物種的基因組比較來研究靈長類物種起源的機(jī)制,基因組的演變與大腦等復(fù)雜性狀的關(guān)聯(lián),以及人類基因及變異的起源和演變規(guī)律。
“研究靈長類演化的過程和與近緣物種的基因組比較可以告訴我們哪些DNA序列是真正人類特異的,這些人類特異的DNA序列往往對(duì)人類獨(dú)特性狀的出現(xiàn)和正常發(fā)育發(fā)揮了重要作用。另一方面,我們還可以知道哪些DNA序列是人類和其他物種共有的,甚至在長期的演化過程中,由于發(fā)揮了非常重要的作用,在過去幾千萬年的演化歷史幾乎沒有發(fā)生任何變化。而這些序列一旦在現(xiàn)代人里出現(xiàn)變異,往往會(huì)導(dǎo)致疾病或者不良表型?!睆垏菡f。
這一領(lǐng)域的難點(diǎn)在哪? “和人類一樣,靈長類基因組有接近30億個(gè)堿基,2萬多個(gè)基因,每個(gè)堿基、每個(gè)基因都有自身的演變過程。物種分化的過程并非一分為二的簡單過程,如果把所有不同基因組區(qū)域的演變過程匯總起來,可以看到物種變化的過程其實(shí)是DNA信息不斷交換,古老的遺傳信息被新物種繼承,同時(shí)新物種積累新的遺傳變異,最終形成DNA信息的變化網(wǎng)絡(luò)。” 張國捷向澎湃科技表示,如何在復(fù)雜交織的基因網(wǎng)絡(luò)里找到可能導(dǎo)致重要節(jié)點(diǎn)關(guān)鍵形狀產(chǎn)生的關(guān)鍵變異,是一項(xiàng)很有挑戰(zhàn)的工作。
張國捷表示,下一階段,靈長類基因組計(jì)劃有兩個(gè)研究方向,一是希望對(duì)更廣泛的物種進(jìn)行基因組研究,進(jìn)一步解釋物種的起源規(guī)律和不同類群之間表型性狀、生理結(jié)構(gòu)、生活史差異的遺傳基礎(chǔ)?!叭澜绗F(xiàn)存500多個(gè)靈長類物種,目前我們只對(duì)其中1/10的物種開展了基因組學(xué)研究?!倍窍MM(jìn)一步從功能機(jī)制上研究基因組的差異如何引起表型的差異,揭示在歷史上基因組哪些關(guān)鍵變化影響了人類特異性的表型的出現(xiàn)。
相關(guān)論文鏈接:
1.https://.science.org/doi/10.1126/science.abn6919
2.https://.science.org/doi/10.1126/science.abn4409
3.https://.science.org/doi/10.1126/science.abl4997
4.https://.science.org/doi/10.1126/science.abl8621
5.https://.science.org/doi/10.1126/science.abn8197
6.https://.science.org/doi/10.1126/science.abn7829
7.https://.science.org/doi/10.1126/science.abn8153
8.https://.science.org/doi/10.1126/science.abo1131