三倍體生菜基因組文章解讀

文章推薦指數: 80 %
投票人數:10人

摘要

萵苣屬(Lactuca sativa)是一種大宗作物,也是大型的、進化非常成功的菊科開花植物的成員之一。

生菜(Lactuca sativa L.)是重要的蔬菜作物,在美國排名前十的最有價值的作物之一,年產值超過24億美元。

生菜是二倍體,有2n= 2x= 18條染色體,估計基因組大小2.5Gb。

由於其基因組大和高重複序列,完成其基因組測序具有挑戰性。

我們對生菜的基因組進行了測序和組裝。

使用各種方法,其包括廣泛應用的mate-pair文庫和Chicago技術。

Chicago技術是染色體構象捕獲技術的應用,以幫助基因組組裝。

該基因組採用全基因組鳥槍法和Chicago技術以構建大的super-scaffolds,這些super-scaffolds通過遺傳圖譜定位到9條假染色體上。

同時確定了幾個可能有助於植物發育相關的基因組特徵,包括編碼類似Cycloidea轉錄因子的基因,激酶和參與膠乳生物合成的酶和在抗病相關的蛋白。

鑑定了21種新型microRNA,其中1個可以從許多激酶轉錄物觸發phasiRNA。

我們為菊科基部植物全基因組三倍體化事件提供了證據。

我們檢測到占基因組26%的三倍體區域中,有30%的基因富集在調節序列並參與植物防禦功能。


圖:通過HiRise軟體提高生菜基因組組裝質量(a)通過使用HiRise,基因組裝配的連續性更高。

(b)通過RILs群體構建最長的superscaffold。

紅色條代表生菜等位基因,藍色條代表L. serriola等位基因,黃色條代表雜合子。

基因型頂部黑線中的交替不連續性表示SOAPdenovo scaffolds之間的連接。

(c)在兩個HiRise組裝結果中,定向和併入同一個scaffold。

基因組測序和組裝

使用全基因組鳥槍法對生菜栽培品種Salinas的基因組進行序列和組裝。

從不同片段大小(170bp至40kb)的7個文庫產生了總共198.5Gb的paired-end and mate-pair數據。

過濾後,利用72.5倍覆蓋率的數據通過K-mer分析估計基因組大小為2.7Gb。

通過SOAPdenovo組裝的結果包括153,952個contigs和21,686個大於1 kb的scaffolds,最長的scaffold達到3.1 Mb。

contig和scaffold N50分別為12Kb和476 Kb。




生菜基因組circle圖

轉座內容和注釋

通過比較,我們發現了1.8 Gb(占整個基因組2.38 Gb的74.2%)的重複元件。

最豐富的是長末端重複反轉錄轉座子(LTR-RT),特別是Gypsy (33.9%) and Copia (24.9%)。

除了主要的LTR-RT元件組外,4.4%的基因組注釋為微型反轉轉錄重複元件,其中1.2%作為DNA元件,其餘被分類到其他重複家族或不能分配。

重複元件分布在所有染色體上; 幾條染色體的內部區域具有較高的重複性。

轉座內容和注釋

通過合併來自不同預測方法的基因模型,建立了生菜具有良好蛋白質或EST支持的38,919個基因型的高置信基因集。

這些基因模型的平均編碼長度為1.05kb,平均每個基因有4.5個外顯子,類似於其他測序的植物基因組。

基因組三倍化

與已公布的植物基因組比較,生菜相比葡萄,染色體保護與生長習性和發育時間如預期一樣。

生菜相比長發育時期或無性繁殖的物種(可可,馬鈴薯,毛果,冬蟲夏草)較具有更快的生命周期。

可檢測的線性程度也與倍性水平相關。

相比A. thaliana (8n) 和B. rapa (12n) ,T. cacao(2 n)與V. vinifera (2n)表現出更多的線形關係。

與此相符,生菜(6 n)顯示了與V. vinifera 相似的線性關係。

這兩足基因組之間的綜合證據表明了與葡萄譜系分歧的生菜全基因組三倍體事件。

V.vinifera染色體1,3,9,11,15,16和17幾乎完全在生菜的三個不同位置複製。

多個多倍體化事件已經在多個植物中被報導(唇形科,杜鵑花科,傘形科和菊科)。

在分離這些Asterid家族之後,分析成對的合成酶之間的突變率與茄科和唇形科的全基因組重複事件是一致的。

所有這些物種之間的系統發育關係相關事件都是基於CEG基因序列分析的。

(a)生菜與歐洲葡萄共線性(X軸:生菜染色體; ÿ軸:歐洲葡萄染色體)。

(b)對於基因內比較和用於線性對估計同義替換率(DS)的密度分布(c)Asterid進化枝的RAxML系統發育樹;每個位點的估計核苷酸替換量表。

(b)觀察到的全基因組複製/三重事件的推斷位置。

(d)三倍體旁系同源基因在生菜基因組中的分布。

染色體假分子沿三軸逐漸排列:x:LG1,LG4,LG7; y:LG2,LG5,LG8; z:LG3,LG6,LG9。

WGT,全基因組三倍。

總之,所檢測到的三倍體區域覆蓋的至少651 MB 水稻基因組(該基因組的26%)和含有11816(30%)的所有預測的基因。

在這些區域的基因中,2,912(25%)保留了至少一個共同對應物。

一些類型的基因在三倍體區域中富集,這些包括編碼轉錄因子和DNA結合蛋白的基因以及核,核小體,膜和細胞壁的組分。

這些轉錄因子包含廣泛的功能域(AP2,Homeobox,KNOX,WRKY,TCP)。

在54個TCP轉錄因子中,27個存在於三倍體區域中。

一些基因在檢測到的三倍體區域中的代謝不足。

編碼與防禦反應,信號轉導,蛋白激酶活性和蛋白磷酸化活性相關的蛋白質的基因在三倍體區域中不太普遍;,在三倍體區域中檢測到437個NB-LRR候選基因中僅有29個,21個LOX基因中有3個。

這些類型的基因的分布可能反映了它們所處的基因組信息,而不是基因損失本身。

討論

生菜的這個基因組組裝結果是目前為止所報導的所有植物里尤其是對於具有高重複含量的2 Gb以上植物基因組而言是一個更完整的基因組。

生菜基因組是菊科植物里一個有代表性的基因組。

它提供了第一個高質量,被驗證的菊科參考基因組。

在生菜中檢測到的全基因組三倍體事件與向日葵基本一致,與最近在胡蘿蔔報導的三倍體事件不同。

有趣的是,這些事件似乎都同時發生與或白堊紀-古新世過渡(66 MYR)後不久,這個時期大約有75%的物種滅絕了。

這種多倍化時間導致物種進化創新和表型可塑性,賦予了成功定居干擾棲息地的選擇優勢。

如在其他植物和動物的全基因組複製中一樣,編碼一些但不是全部轉錄因子的基因在生菜基因組的三倍體區域中富集。

序列分歧的模式表明WRKY基因5'末端的亞功能化,以及AP2和MADS基因可能的新功能化。

這些機制的變化可能導致新的表型,使其能夠適應新的環境。

其他基因組特徵有助於可能參與複雜頭狀花序(許多花的複合物)的形成的類環狀基因的多樣化; 這樣一個精心進化的生殖器官可能對傳粉者更有吸引力。

菊科植物同樣以其次生代謝產物的多樣性而聞名。

涉及生產膠乳的基因為其提供了生菜特徵性的乳狀液體,這些膠乳可能涉及生物脅迫的防禦。

還有一個有趣的是,有超過20個新的miRNA,其中一個靶向激酶轉錄本;可能意味著另一個調控創新,對其他菊科物種的miRNA序列進行分析將具有參考價值。

這個高質量的參考基因組為菊科的綜合研究提供了基礎。

它也將大大促進作物改良所需的基因編輯研究,特別是涉及非生物和生物脅迫抗性的基因組。

小編感言:

該文章介紹了一種特殊的菊科蔬菜——生菜基因組,但其基因組組裝contig和scaffold N50分別為12Kb和476 Kb,放到現在真心被三代虐成渣。

而且在組裝上在二代測序的基礎上應用了Chicago技術,提升Scaffold,利用遺傳圖譜掛載到染色體上。

(沒有應用Hi-C技術組裝到染色體並與遺傳圖譜進行互相驗證,少了一個亮點表示遺憾)。

在分析內容上也只是介紹了常規的組裝注釋、基因及蛋白家族預測等基本分析,此外注重強調了三倍化事件,最終該文發表在Nature Communications上面,主要優點是因為物種特殊,菊科發表的很少。

但缺點是組裝質量差、內容簡單,研究的不精細,所以上不了Nature Genetics、Nature等生物學頂級期刊。

參考文獻

Sebastian Reyes-Chin-Wo1, Zhiwen Wang, Xinhua Yang, et al.Genome assembly with in vitro proximity ligation data and whole-genome triplication in lettuce[J]. Nature Communications, 2017.


請為這篇文章評分?


相關文章