Nature封面文章:三代測序組合技術引領基因組測序新風潮

文章推薦指數: 80 %
投票人數:10人

最新研究將PacBio三代測序、Bionano光學圖譜、Hi-C技術等技術結合在一起,獲得了高質量染色體級別的藜麥參考基因組序列,這不僅為藜麥研究提供了更加完備的參考數據,而且也為基因組測序領域帶來了風潮。

隨著研究的深入,科學家們對基因組測序的要求越來越高,三代測序技術應運而生,並且通過將 Pacbio + BioNano + Hi-C + Illumina多級層組合在一起,科學家能從頭合成組裝出染色體水平的基因組,這將成為未來基因組測序的新標杆。

來自沙特阿卜杜拉國王科技大學的研究人員與多國研究人員合作,在Nature雜誌封面上發表了「The genome of Chenopodium quinoa」,即藜麥基因組序列,藜麥(Quinoa)是一種高營養穀物,被譽為「超級食物」。

這項最新研究公布了藜麥的異源四倍體基因組,還測序了其它二倍體和四倍體藜屬(Chenopodium)物種的基因組,從而揭示了藜麥的遺傳多樣性和亞基因組的演化過程。

這將有助於促進藜麥的遺傳改良和育種策略,提高全球糧食安全。

但這其實並不是藜麥基因組的第一張測序圖譜,去年日本科學家採用短讀長的二代測序技術結合低深度的PacBio測序數據,但最後只得到了草圖(draft),並非完整的參考基因組,文章僅發在了DNA Research(IF:5.267)雜誌上。

時隔半年,為何此次對藜麥的測序可以發到Nature(IF:38.138)封面上呢?

原因在於最新研究將PacBio三代測序、Bionano光學圖譜、Hi-C技術等技術結合在一起,獲得了高質量染色體級別的藜麥參考基因組序列,這不僅為藜麥研究提供了更加完備的參考數據,找到了令這種食物產生苦味的基因,而且也為基因組測序領域帶來了風潮。

過去十多年間基因組測序令生物學研究的許多領域煥然一新,但隨著研究的深入,科學家們對基因組測序的要求越來越高,三代測序技術應運而生,並且通過將 Pacbio + BioNano + Hi-C + Illumina多級層組合在一起,科學家能從頭合成組裝出染色體水平的基因組,這將成為未來基因組測序的新標杆。

Pacbio三代測序技術

以最新完成藜麥基因組為例,文章採用RNA-Seq和PacBio的Iso-Seq分別分析了轉錄組選擇性剪切情況:

圖中上部顯示的是PacBio Iso-Seq轉錄組測序結果,中間部分顯示的是Illumina RNA-Seq測序結果。

上兩部分的灰色線條表示內含子區域。

底部顯示的是AUR62017258基因所在的染色體位置。

明顯可以看出,PacBio的長讀長技術無需拼接用於全長轉錄本測序,可以在一個reads中完全覆蓋從5′非翻譯區,所有外顯子和3′非翻譯區。

而短讀長技術則需要進行組裝。

藜麥的進化歷史:

藜麥是由祖源的A和B兩個二倍體品種雜交而來。

之前的單基因測序研究鑑定到種質庫中,北美和歐亞兩個二倍體分別為A亞基因組和B亞基因組的候選來源,後來在北美某處發生了雜交。

為了進一步了解藜麥的基因組結構和進化,作者對A基因組二倍體C. pallidicaule和B基因組二倍體C. suecicum進行了測序、組裝和注釋。

藜麥中同源基因對的很大比例在每個同義位點表現出相似的同義替代率,表明全基因組的複製事件。

作者估計重組大約發生在3.3-6.3百萬年前。

進化樹分析表明北美C. berlandieri是物種綜合的基本成員。

藜麥被認為是在一次單獨事件中從C. hircinum馴化而來。

而作者的測序數據表明藜麥可能分別在高原和沿海環境被獨立馴化。

作者從這些登記樣本和參考藜麥基因組中找到了總共7,809,381個SNP,包括2,668,694個藜麥特異的SNP。

這將有助於評估其遺傳多樣性,以及鑑定有有價值的性狀相關的基因組區域。

亞基因組特點分析:

通過把來自C. pallidicaule 和C. suecicum 的測序結果mapping到藜麥的scaffold組裝結果上,進行BLASTN把每個二倍體與藜麥的scaffold比對,發現分別有156個和410個藜麥scaffold比對到A基因組和B基因組上(總共202.6Mb和646.3Mb)。

5,807個同源基因對在染色體上的定位揭示其與A,B亞基因組的高度共線性。

皂苷合成的潛在機制:

a. 藜麥種子的外皮中的皂苷質譜分析成像

b. 在種子發育期間通過總酸量測定檢測皂苷的積累

c. 群體中,甜味後代與苦味後代相比的等位基因頻率的比例差異

d. 皂苷生物合成途徑,註明了途徑中催化每一步反應的酶和編碼每個酶的基因ID

e. 苦味和甜味品種中的TSARL1基因模式

藜麥種子中含有皂苷(saponins)。

儘管這對於植物生長有益(比如阻止食草性動物),但是為了人類能夠食用,必須去除掉,因為其具有溶血性和苦味。

但要去除皂苷,費用太高,耗水量大,也會降低種子的營養價值。

作者發現皂苷集中於開花期後20-24天的果皮中,最終占到種子總質量的4%(w/w)。

天然存在的甜味藜麥含有很低的皂苷水平,儘管潛在的調控基因尚不清楚。

為了找到這些基因,作者進行了兩個雜交分離群體的連鎖圖譜和BSA的分析:Kurmi (甜味) × 0654 (苦味),和Atlas (甜味) × Carina Red (苦味)。

與其他群體中得到的結果相同,這些群體中的分離比表明種子中皂苷的存在是由一個單獨的基因控制的。

皂苷的有無與種皮厚度差異相關。

苦味的品種比甜味品種有更厚的種皮。

BioNano光學圖譜技術

這項研究還利用了BioNano 的Irys單分子光學基因圖譜系統,這一系統曾入選生物通2015年的年度創新產品。

目前許多測序技術需要打斷並擴增DNA。

這往往犧牲了長距離的信息,導致研究人員錯過了許多結構變異,包括重排、倒位和拷貝數變異。

為了實現更高質量的基因組分析並獲得全面的變異視圖,人們需要一張完整的基因組圖譜。

為此,BioNano開發出Irys系統。

Irys單分子光學基因圖譜系統是以普林斯頓大學開發的一種革命性的納米通道技術為核心,對基因組DNA進行超長單分子高解析度成像,從而有助於在基因組生物學層面獲得一個更全面更完整的信息,包括結構變異。

這個系統利用納米材料工程的進步來實現這一點,而不是藉助PCR和克隆等常規方法。

它在納米通道晶片IrysChip上線性化並均勻拉伸極長的DNA片段,從而保留了基因組的真正結構。

之後通過超長單分子高解析度螢光成像,繪製出基因組圖譜。

將BioNano光學圖譜技術與PacBio的三代測序技術結合在一起,這篇文章並不是第一次,去年發表在《Nature Methods》雜誌上的論文中,來自美國西奈山伊坎研究所等機構的研究人員對DNA樣品直接進行人類全基因組測序,而無需將DNA克隆到細菌中。

這項研究使用的是世界上了解最透徹的人類基因組NA12878,但儘管如此,研究人員還是發現了一些之前從未捕獲到的結構事件,還有一些跨越了參考基因組上的缺口。

他們還發現,人類參考基因組低估了短串聯重複序列的擴增。

Hi-C技術

高等生物的細胞核負責儲存基因組DNA,這些DNA環繞著由四種組蛋白組成的八聚體,形成碟狀的核小體結構。

基因組DNA以這樣的形式包裝成為染色質,使DNA受到良好的保護。

所有控制基因轉錄的調控蛋白,都要結合在DNA上起作用。

而染色質的3D結構會隨著細胞生活周期而變化,調節調控因子所能接觸到的基因,這對於基因的功能和疾病的發生具有重要意義,但目前基因組測序技術似乎都迴避了這個問題。

Hi-C技術源於染色體構象捕獲 (Chromosome conformation capture, 3C)技術,利用高通量測序技術,結合生物信息分析方法,研究全基因組範圍內整個染色質DNA在空間位置上的關係,獲得高解析度的染色質三維結構信息。

Hi-C技術不僅可以研究染色體片段之間的相互作用,建立基因組摺疊模型,還可以與RNA-Seq、ChIP-Seq等數據進行聯合分析,從基因調控網絡和表觀遺傳網絡來闡述生物體性狀形成的相關機制。

此外,Hi-C可以應用於基因組組裝,提升基因組組裝水平。

Hi-C用於基因組組裝最初是在2013年,首先應用於人、小鼠、果蠅;2015年,Hi-C輔助基因組組裝首次用於植物(擬南芥)基因組組裝。

在藜麥基因組文章中,作者採取PacBio 、BioNano 、Hi-C 等多種技術,加入Hi-C技術使基因組組裝完好,scaffold N50達到3.84Mb,獲取到了染色體水平的基因組,提升了文章水平。

目前安諾基因作為國內首家提供Hi-C全面測序服務的公司,可以提供動物Hi-C、植物Hi-C、單細胞Hi-C、捕獲Hi-C、Hi-C輔助基因組組裝等技術服務。

來源:生物通


請為這篇文章評分?


相關文章