癌症基因組學研究全程回顧

文章推薦指數: 80 %
投票人數:10人

這篇文章的內容不是我的原創,它來自於Illumina cancer review

癌症,一種慢性的基因病。

簡介

在癌症研究中,每個癌症樣品呈現在研究人員眼前的已經是一個發生了改變的基因組,其中包含著獨特且難以預測的諸多點突變、序列的插入缺失、易位、融合以及其他畸變。

並且,這些發生的變異中,許多往往都是之前所未觀察到的(Novel mutations),它們也不會只存在於基因組的編碼區域中,因而為了能夠真正做到全面研究癌症基因組本身所發生的所有突變事件,全基因組測序已被視為腫瘤基因變異研究中 唯一 嚴謹的方法。

然而,在所有這些變異中,卻只有少數的幾個主導著癌症這一疾病的發展和演變。

要有效揭示這一演變和發展的過程,就需要監控基因表達水平上的變化,那麼RNA-Seq便是用以確定這些遺傳改變是否會影響疾病發展有用技術。

但遺傳改變有可能影響所有的細胞過程,包括染色質結構、DNA甲基化、RNA剪接異構體、RNA編輯和microRNA(miRNA)等。

這就意味著,只有對所有這些獨立的過程都進行檢測和綜合分析,才能在癌症研究中取得真正的突破。

這些內容我們都將在下文一一展開。

當前基因組測序技術的一大特點是在於能夠在很短的時間內並行測得數十億(甚至數百億)的獨立序列片段——read,而每個read來源於單個的DNA分子。

由此產生的數據我們可將其視為是對DNA分子的隨機抽樣,這反過來代表腫瘤樣品中每個細胞的基因組的情況。

這是我們解開癌症的原因和機制的一種強大工具。

腫瘤異質性

癌症基因組的突變是複雜的。

每個人都攜帶一套獨特的來自父母遺傳的胚系突變(germline mutations)信息。

但隨著癌症的發展,體細胞突變(Somatic mutations)和基因組重排(genomics rearrangements)會逐漸增加。

這些改變往往會引發耐藥性以及轉移。

越來越多的研究證據表明,這些過程竟然可以是 有意的!——它們其實可以認為是癌細胞面臨藥物刺激的過程中不斷進化的結果。

我們想要全面地理解這一復發和耐藥性的原因,就有必要進行縱向實驗,按照癌症的發展過程,分階段採集樣品來進行研究。

如上圖,這是處於正常組織背景下的多克隆腫瘤(polyclone tumor)。

大多數的腫瘤樣品都會同時包含腫瘤細胞和正常細胞,如基質細胞、血管和免疫細胞。

並且腫瘤本身也常常包含幾種不同的克隆亞型(clone types),每一種都有著不同的治療反應和復發可能。

根據傳統病理學的估計,大部分研究的結果其實都只集中在那些腫瘤細胞比例 >60% 的區域中。

並且為了確定哪些突變是腫瘤特異的,通常都要包含來自同一個體的正常組織樣本作為參考。

然而,腫瘤本身也往往是異質性的。

在癌症發展的過程中,個別細胞會發生新的突變,包含這些新突變的細胞會繼續增殖,形成克隆亞型。

因此,對於晚期癌症我們通常檢測到的都是一個多克隆腫瘤,其中每一個克隆有一套獨特的突變信息、獨特的病理學和藥物反應機制。

這其實也正是癌症難以完全治療的原因,而它的這種 異質性其實正是腫瘤基因組複雜性導致的一種表型性質。

目前的深度測序可以檢測樣本中含量低至1%的克隆。

腫瘤內的異質性。

體細胞突變的逐步累積產生了一個異質的多克隆腫瘤,其中不同克隆可能對治療的反應不同。

而且,異質性一般還可以分兩種情況討論,第一種情況指的是:同一個病人的腫瘤細胞具有異質性。

處於腫瘤發生的不同時期的腫瘤細胞的基因突變情況不同,造就了每一個腫瘤細胞群體內還有許多亞群(subclones),腫瘤細胞在通過轉移時,就會有屬於不同亞群的腫瘤細胞去侵入新的地方,形成新的腫瘤;第二種情況指的是:除了同一病人的不同腫瘤細胞會造成腫瘤的異質性外,腫瘤的異質性還體現在不同病人可能得了相同的腫瘤,但是那個『相同』未必真是相同——僅僅是表型相同,不代表著基因型也相同。

在某些基因中,突變頻繁發生在同一個位置,這應該有特定的機制在起作用,這些有規律性的情況都會稍微容易對付。

然而遺憾的是,對於大多數的基因,突變顯然是隨機出現在整個基因中的,這其實說明了DNA的複製和修復機制失靈了。

圖中為兩個假定的基因,他們有著兩種不同的突變模式。

深灰色框代表外顯子組,而紅色柱子代表存在突變的位置。

A: 特定位置的頻發突變可能表示有產生突變的生物學機制的參與。

B: 散發突變存在於整個基因中,如P53,可能是由於複製和修復機制的失效。

我們可以通過測序檢測這兩種情況下的突變。

參考文獻

2012年Ding Li等人發表在Natrue上的一項研究弄清了急性髓細胞白血病(AML)的復發原因。

他們發現了兩個一般機理:(1)原發腫瘤中的始發克隆(founding clone)獲得突變,進化成復發克隆;(2)始發克隆的一個亞克隆挺過了初次治療,獲得了更多突變並在復發時增殖。

在一個病例中,原發腫瘤里原本僅占5.1%的亞克隆在復發後卻成長為主要的克隆。

而且對於所有的病例,化療並不能夠根除這些始發克隆。

這項研究直接表明了在診斷後和初次治療後檢測並根除掉那些原本不起眼的小細胞群體有多麼的重要!Ding L., Ley T. J., Larson D. E., Miller C. A., Koboldt D. C., et al. (2012) Clonal evolution in relapsed acute myeloid leukaemia revealed by whole-genome sequencing. Nature 481: 506-510

同樣是2012年,同樣是Ding Li這波人,同樣是研究AML,他們這次發現大約三分之一的骨髓增生異常綜合徵患者會發展成繼發性急性髓細胞白血病(AML)。

這個研究的目的是為了確定骨髓增生異常綜合徵中的突變,它們有可能預測AML的進展。

他們對七名繼發性AML患者的七組皮膚和骨髓樣品以及先前的骨髓增生異常綜合徵的配對骨髓樣品一併做了全基因組測序。

結果發現,在所有病例中,占主導地位的繼發性AML克隆都是來自一個骨髓增生異常綜合徵的始發克隆。

這其實就是說,骨髓增生異常綜合徵樣品包含了對預後很重要的突變,針對這些突變的治療方案是可能改善預後的。

Walter M. J., Shen D., Ding L., Shao J., Koboldt D. C., et al. (2012) Clonal architecture of secondary acute myeloid leukemia. N Engl J Med 366: 1090-1098

繼續腫瘤治療和預後的話題,Gerlinger M這一波人發起了一項研究,利用全外顯子組測序來研究多個樣品,這些樣品不僅來自兩名患者體內的原發腎癌,還包括了患者相關轉移部位的空間分隔區域。

最後,他們在原發腫瘤中看到了廣泛存在的異質性現象!而且還特別指出了在每個腫瘤區域內有63%-69%的體細胞突變是無法檢測到的。

同時,還檢測了同一腫瘤不同區域內預後良好和不良的基因表達特徵。

這其實還是突出了在突變積累之前早期診斷的重要性,以及對較大腫瘤需要進行多個部位的活檢。

利用同一名患者的多個樣本得到的信息,他們能夠重建疾病的發展進程!這是一種極為強大的方法,不僅能檢測引發事件,還能檢測表現出平行進化的基因。

平行進化通常是基因在進化壓力下的一種表現,其實也表示那些基因可能成為有效的治療靶點。

Gerlinger M., Rowan A. J., Horswell S., Larkin J., Endesfelder D., et al. (2012) Intratumor heterogeneity and branched evolution revealed by multiregion sequencing. N Engl J Med 366: 883- 892。

轉移

腫瘤的轉移是一個複雜的過程,其中癌細胞脫離原發腫瘤,通過血液或者淋巴系統循環到身體的其他部位。

在新部位,細胞繼續繁殖,最終形成更多腫瘤,這些腫瘤包含了反映其組織來源的細胞。

腫瘤(胰腺癌和葡萄膜腫瘤)轉移的能力大大增加了它們的致死性。

關於轉移腫瘤的克隆結構、轉移酶之間的系統發育關係、轉移和原發部位的平行進化規模,腫瘤如何擴散,以及腫瘤微環境在轉移部位決定中的作用如何等,許多這些基本問題目前仍然沒有很好地解決。

轉移瘤可能來源於原發腫瘤中一個主要克隆(如上圖:Metastasis1),也可能來源於次要克隆(Metastasis2)。

轉移瘤也會經歷克隆進化(如Metastasis1所示)

參考文獻

Hsieh A. C., Liu Y., Edlind M. P., Ingolia N. T., Janes M. R., et al. (2012) The translational landscape of mTOR signalling steers cancer initiation and metastasis. Nature 485: 55-61

這篇文章證明了攝護腺癌基因組經由致癌mTOR通路的特殊翻譯機制,這其中產生了一個特定的基因群,它們參與了細胞增殖、代謝和侵襲。

隨後作者對一類翻譯控制前侵襲信使RNA進行了功能鑑定,並指出了這些mRNA主導了癌症侵襲和轉移。

基因組突變

所有的腫瘤在其發展的過程中都會不斷積累體細胞突變(somatic mutations)。

大多數常見的腫瘤與不同的癌基因相關聯,這些癌基因以低頻率發生突變。

從大型癌症資料庫中觀察到的一個最令人驚訝的現象是癌症間甚至各個癌症類型內的顯著遺傳異質性。

然而,似乎只有有限的細胞通路對腫瘤的細胞生物學很重要。

目前很多人正在編輯收錄各種癌症類型的體細胞突變綜合列表,這對於更好地了解這種疾病背後的機制將有很大的指引作用。

研究參考

Nik-Zainal S., Alexandrov L. B., Wedge D. C., Van Loo P., Greenman C. D., et al. Mutational processes molding the genomes of 21 breast cancers. Cell 149: 979-993 這篇文章中研究了21個乳腺癌基因組,並給出了它的一個體細胞突變列表。

發現帶BRCA1或者BRCA2突變的癌症會有一種特別的替換突變特徵和與眾不同的缺失圖譜。

文章中還描述了一種局部的超突變現象,這稱為『kataegis』(kataegis,希臘語中『雷雨』的意思,文中指的是在一個小區域中出現大量突變的機制,如下圖)。

並且這些區域中的鹼基替換幾乎都發生在TpC二核苷酸的胞嘧啶上!

這是Kataegis圖像。

縱軸是突變間距(對數刻度)。

這個圖中基因組內大部分的突變都有著1,000,000bp 的突變距離。

其中超突變區即是表現為突變間距較低的簇。

Govindan R., Ding L., Griffith M., Subramanian J., Dees N. D., et al. Genomic landscape of non-small cell lung cancer in smokers and never-smokers. Cell 150: 1121-1134

這是另一篇文章,主要是對17個非小細胞肺癌(NSCLC)患者的肺癌及癌旁正常組織樣本進行了全基因組和轉錄組測序。

值得注意的是吸菸者中所觀察到的突變頻率比不吸菸者高10倍!這是通過深度測序揭示出的這些群體間所不同的克隆模式。

而且其中所有經過驗證的EGFR和KRAS突變都存在於原始克隆中,這其實也就表明了它們在癌症啟動中可能發揮非常重要的作用。

鑲嵌性

對於這個現象我們也同樣通過實際的研究來說明。

AML(急性髓細胞白血病)基因組中發現的大多數突變實際上是隨機事件,在造血幹細胞/祖細胞(HSPC)獲得原始突變之前就存在了;但是隨著克隆的擴增,細胞的突變歷史被『捕獲』了。

如何理解這裡的『捕獲』?其實說的就是,原本那些突變都沒什麼鳥用,就擺在那無所事事,但是,在許多情況下,偏偏只需要再來一個或者兩個額外的突變來協助就能共同作用,最後產生惡性的原始腫瘤克隆!

原發腫瘤和轉移的鑲嵌性。

非同義點突變和插入缺失(綠色塊)的區域分布的假設熱圖。

行代表來自七個原發腫瘤區域和六個轉移區域的樣品。

研究參考

Abyzov A., Mariani J., Palejev D., Zhang Y., Haney M. S., et al. (2012) Somatic copy number mosaicism in human skin revealed by induced pluripotent stem cells. Nature 492: 438-442這裡作者發現了一個現象:平均而言,iPSC細胞系表現出2個拷貝數變異(CNV),而這些CNV在iPSC來源的成纖維細胞中不明顯。

他們發現,至少50%的CNV以低頻體細胞變異存在於親本的成纖維細胞中。

根據這一觀察,他們估計大約30%的成纖維細胞的基因組中攜帶體細胞CNV,這表明體細胞鑲嵌性廣泛存在於人體中。

基因融合

基因融合是非常普遍的,也是癌症的一個重要特徵。

現在的研究發現,一個強啟動子與一個下游功能基因(比如:原癌基因)的融合在某些癌症中很普遍。

據估計,半數的攝護腺癌含有TMPRSS2和ETS轉錄因子家族成員之間的融合。

基因融合是由兩個原本分開的基因或位點融合形成的。

他們可能形成一種基因產物,很多時候表現出來的功能都是全新的,與兩個融合的基因個體都不同。

這種陰差陽錯的情況可能引起致癌機制的激活,就像費城染色體陽性急性淋巴細胞白血病一樣。

這種基因融合導致BCR-ABL酪氨酸激酶表達,從而激活細胞增殖。

有幾種機制會導致基因融合的發生,這個現象是一些癌症類型的特點。

胰腺癌的特點便是染色體重排的頻繁斷裂-融合-橋循環。

目前有幾種方法可以通過測序研究融合事件,如對腫瘤的全基因組測序和mRNA-Seq。

mRNA-Seq與全基因組測序組合的方法對於發現基因融合及其機制特別高效。

原因就是mRNA-Seq可以提供直接的證據,來支持觀察到的融合是否發生,並同時為融合基因是否表達提供了證據。

而全基因組測序可以發現那些mRNA-Seq所發現不了的區域的信息,如基因間區和UTR。

由折回倒位所引起的融合事件可捕獲基因組中遙遠區域的片段,如著絲粒重複或參與體細胞重排的區域。

在這個例子中,6號染色體上的片段被插入到19號染色體上的重複區域之間。

注意19號染色體的第二個拷貝是倒置的,這是折回倒位的特點。

MED1(紅色)與幾個夥伴基因(藍色):ACSF2,USP32 和 STXBP4形成基因融合。

實驗上的設計參考

以Pair-end進行全基因組測序是目前檢測基因融合最準確、最全面的工具,這些融合包括重複、倒位、通讀和單鹼基插入缺失。

可以說Pair-end是檢測融合基因成功與否的一個關鍵因素。

另外就是高深度測序結合更長的讀長可以分辨融合連接中微同源的單鹼基。

而且這種能力是測序獨有的。

研究參考

Robinson D. R., Wu Y. M., Kalyana-Sundaram S., Cao X., Lonigro R. J., et al. Identification of recurrent NAB2-STAT6 gene fusions in solitary fibrous tumor by integrative sequencing. Nat Genet 45: 180-185

文章主要是利用了全外顯子組和轉錄組測序發現了轉錄抑制因子NAB2與轉錄激活因子STAT6的基因融合現象。

其中27個獨立性纖維性腫瘤(SFT)的轉錄組測序發現所有腫瘤中存在NAB2-STAT6基因融合。

NAB2-STAT6基因融合的過表達誘導了培養細胞的增殖,並激活了EGR應答基因的表達,最後導致了腫瘤。

Seshagiri S., Stawiski E. W., Durinck S., Modrusan Z., Storm E. E., et al. Recurrent R- spondin fusions in colon cancer. Nature 488: 660-664

這一篇文章則主要分析了70個原發性人結腸癌的外顯子組、轉錄組和拷貝數變異。

拷貝數和RNA-Seq的數據分析確定了在一部分結直腸癌中存在IGF2的擴增和相應過表達。

他們還利用RNA-Seq,在10%的結直腸癌中發現了與R-脊椎蛋白家族成員(RSPO2和RSPO3)相關的基因融合。

這項研究表明了綜合多項技術去了解複雜的癌症基因組很重要。

Thompson-Wicking K., Francis R. W., Stirnweiss A., Ferrari E., Welch M. D., et al. (2012) Novel BRD4-NUT fusion isoforms increase the pathogenic complexity in NUT midline carcinoma. Oncogene

這篇文章則提到了PER-624中一種新的BRD4-NUT融合竟然編碼了一種功能蛋白,並且它對這些細胞的致癌機制很關鍵。

BRD4-NUT融合轉錄本是通過易位後的RNA剪接而產生的,這似乎是這些癌症的一個共同特徵。

這種有助於融合基因的替代異構體表達的機制是第一次報導。

Wen H., Li Y., Malek S. N., Kim Y. C., Xu J., et al. (2012) New fusion transcripts identified in normal karyotype acute myeloid leukemia. PLoS ONE 7: e51203

在這項研究中,作者運用雙端RNA-Seq來發現染色體核型中的融合,它們經傳統的細胞遺傳學分析未檢測到異常。

他們發現了臨近基因間的融合轉錄本以及7個只存在於正常核型中的融合本。

染色體碎裂

這是一個不希望發生的現象,染色體碎裂是一個一次性的細胞危機,在單次事件中發生數十次至數百次基因組重排。

這種災難性事件的後果是複雜的局部重排和拷貝數變異,其中染色體上2個(偶爾3個)拷貝的有限範圍可被檢測。

這種單次災難性事件的模式不同於癌症發展的逐步積累突變的典型模式。

在突變積累的癌症發展模式中,拷貝數無上限,因此通常有一個較大的範圍。

據估計,在所有癌症及其不同亞型之間,染色體碎裂的發生機率約2-3%,而在骨癌中發生機率則大約25%。

染色體碎裂的圖示。

研究參考

Rausch T., Jones D. T., Zapatka M., Stutz A. M., Zichner T., et al. (2012) Genome Sequencing of Pediatric Medulloblastoma Links Catastrophic DNA Rearrangements with TP53 Mutations. Cell 148: 59-71

文章提到一名Sonic-Hedgehong髓母細胞瘤(SHH-MB)患者的大量、複雜的染色體重排,此患者帶有生殖細胞系TP53突變(Li-Fraumeni綜合徵)。

同時將規模擴大到11名Li-Fraumeni綜合徵患者的篩查,發現有36%的腫瘤表現出與染色體碎裂一致的重排。

這比一般腫瘤群體所觀察到的2%染色體碎裂發生率要高得多。

P53的生殖細胞系突變與一些腫瘤中凋亡中止導致染色體碎裂的假說是一致的。

拷貝數變異(CNV)

結構性變異影響基因量——可轉錄基因的功能拷貝數。

腫瘤發展、藥物反應及耐藥性的發生通常是由基本的基因擴增和刪除來驅動的。

這些基因組上的改變可分成大的畸變和小的畸變。

大的畸變包括整個染色體或部分染色體的丟失或重複,這被稱為非整倍體。

小的畸變可能只包含一個鹼基,比如點突變和小片段的插入缺失。

與健康的基因組不同,這些基因表達的改變會受到轉錄因子的嚴格調控,癌症基因組則通過基因的重複和刪除來適應和逃避這種調控。

癌症耐藥性的發生正是此反應的速度和效率的絕佳證明。

基因表達

基因表達分析測定基因轉錄、RNA加工和表觀遺傳控制的產物。

因此,基因表達分析不僅可以看出這些過程的『健康』程度,也可以深入研究細胞裡面的分子機制。

基於晶片的mRNA分析曾在癌症的基因變得研究中廣泛使用,但基於測序的mRNA分析(mRNA-Seq)的出現代表我們測定和解析基因表達產物能力的又一次飛躍。

mRNA-Seq可檢測修飾過的RNA和表達水平極低的RNA的能力讓它特別適合癌症研究。

基於mRNA-Seq的方法也可檢測非常快的轉錄變化、剪接異構體、融合基因以及可變聚腺苷酸化位點。

Feng H., Qin Z. and Zhang X. (2012) Opportunities and methods for studying alternative splicing in cancer with RNA-Seq. Cancer Lett 這篇綜述關注了RNA-Seq在研究癌症相關的可變剪切中的應用。

文中包含一個生物信息學工具列表,以及有關估計可變剪切異構體的表達水平的詳盡討論。

利用RNA-Seq研究癌症中基因表達和選擇性剪接的典型生物信息學流程。

首先,將短read定位到參考基因組或轉錄組。

在定位之後,估算注釋基因和轉錄本的表達與剪接。

van Delft J., Gaj S., Lienhard M., Albrecht M. W., Kirpiy A., et al. (2012) RNA-Seq provides new insights in the transcriptome responses induced by the carcinogen benzo[a]pyrene. Toxicol Sci 130: 427-439

作者發現,RNA-Seq所檢測到的基因比晶片技術多約20%,而表達差異明顯的基因更是接近三倍之多。

因此,他們檢測到的受影響的通路和生物學機制達2-5倍。

作者還在許多基因中發現了可變異構體的表達,包括細胞死亡和DNA修復的調控因子,如TP53、BCL2和XPA,它們與基因毒性反應相關。

他們還發現了功能未知的新亞型,如已知轉錄本的片段、帶有額外外顯子的轉錄本、內含子保留或外顯子跳躍事件。

Kaur H., Mao S., Li Q., Sameni M., Krawetz S. A., et al. (2012) RNA-Seq of human breast ductal carcinoma in situ models reveals aldehyde dehydrogenase isoform 5A1 as a novel potential target. PLoS ONE 7: e50249

作者將三個DCIS模型(MCF10.DCIS、SUM102和SUM225)的表達與三維(3D)覆蓋培養的非致癌乳腺上皮細胞的MCF10A模型進行了比較,確定了DCIS模型共用的表達變化。

他們發現,差異表達的基因編碼了與多個信號通路相關的蛋白。

Meyer J. A., Wang J., Hogan L. E., Yang J. J., Dandekar S., et al. (2013) Relapse-specific mutations in NT5C2 in childhood acute lymphoblastic leukemia. Nat Genet 45: 290-294

作者利用RNA測序,報導了診斷和復發相配對的骨髓標本的轉錄本圖譜,這些標本來自十名患有小兒B淋巴細胞白血病的個體。

轉錄組測序鑑定出20個新獲得的突變,它們不存在於最初的診斷中,而2名個體帶有復發特異的突變。

帶有NT52C2突變的所有個體都在初步診斷後36個月內復發。

實驗設計上的注意事項

RNA-Seq已成為一種研究腫瘤分子變化的常規應用,大部分研究人員採用生產商的試驗流程。

rRNA的去除可提高信噪比,實現低表達轉錄本的檢測。

癌症中的體細胞突變基本上是 de novo。

測序不需要關於突變的先驗知識,即可準確定位突變以及得到轉錄本豐度。

腫瘤通常包含各種細胞。

mRNA-Seq的可延伸檢測範圍和準確性對檢測微小的表達變化非常寶貴。

只要腫瘤轉錄本包含了獨特的體細胞突變或剪接變異體,那麼就可將它與正常的細胞區分開來。

二代雙端對讀測序檢測基因融合的靈敏度取決於許多因素,包括表達水平、轉錄本長度、所使用的樣品製備方法以及cDNA文庫的片段長度。

大部分實驗方案採用poly(A)富集的RNA製備方法來測定mRNA水平。

然而,非編碼RNA,如miRNA,也在細胞的生物學中發揮重要作用,並常常介導對腫瘤生長和存活很關鍵的過程。

非編碼RNA可通過現有的poly(A)-(rRNA去除)實驗方案輕鬆分析。

RNA表達是組織和細胞類型特異的。

在選擇腫瘤-正常對照中的對照時,應考慮這一點。

選擇性剪接

癌症的生物起源、發展、轉移與轉錄組中的許多變異相關聯。

癌症特異的選擇性剪接是個普遍存在的現象,也是個主要的轉錄後調控機制,涉及到許多癌症類型。

Seo J. S., Ju Y. S., Lee W. C., Shin J. Y., Lee J. K., et al. (2012) The transcriptional landscape and mutational profile of lung adenocarcinoma. Genome Res 22: 2109-2119 作者分析了韓國200個肺腺癌。

他們在LMTK2、ARID1A、NOTCH2和SMARCA4中發現了新的驅動突變。

他們還發現了45個融合基因,其中8個是嵌合的絡氨酸激酶。

在17個反覆發生的選擇性剪接事件中,原癌基因MET中的第14號外顯子跳過可能是癌症驅動因素。

這項研究表明了這種癌症的複雜性以及運用幾種技術的價值。

Liu J., Lee W., Jiang Z., Chen Z., Jhunjhunwala S., et al. (2012) Genome and transcriptome sequencing of lung cancers reveal diverse mutational and splicing events. Genome Res 22: 2315- 2327 作者對19個肺癌細胞系和3組肺部腫瘤/正常樣本配對開展了全基因組測序和轉錄組測序。

他們鑑定出106個與癌症特異性的異常剪接相關的剪接位點突變,包括一些已知的癌症相關基因中的突變。

RAC1b是RAC1 GTP酶的一個異構體,含有一個額外的外顯子,被認為在肺癌中優先上調,並對MAP2K(MEK)抑制劑PD-0325901敏感。

Thompson-Wicking K., Francis R. W., Stirnweiss A., Ferrari E., Welch M. D., et al. (2012) Novel BRD4-NUT fusion isoforms increase the pathogenic complexity in NUT midline carcinoma. Oncogene 這篇文章發現了PER-624中一種新的BRD4-NUT基因融合編碼了一種功能蛋白,它對這些細胞的致癌機制很關鍵。

BRD4-NUT融合轉錄本是通過易位後的RNA剪接而產生的,這似乎是這些癌症的一個共同特徵。

這種現象以及促進融合基因的可變異構體表達的機制,過去一直未被發現。

RNA編輯

在我們人體中,DNA和RNA序列之間的差異也被稱之為 RNA編輯,這是一種廣泛存在的現象。

最頻繁的RNA編輯類型是通過腺苷脫氨酶作用於RNA(ADAR)從而實現由腺苷到肌苷的轉換。

然後緊接著,剪接和翻譯機制會將肌識別為鳥苷。

在一些腫瘤基因組比正常基因組有著更更比例的RNA-DNA差異。

Jiang Q., Crews L. A., Barrett C. L., Chun H. J., Court A. C., et al. (2013) ADAR1 promotes malignant progenitor reprogramming in chronic myeloid leukemia. Proc Natl Acad Sci U S A 110: 1041-1046 作者發現,慢性髓細胞白血病(CML)急變期的祖細胞有著更高的IFN-r通路基因表達以及BCR-ABL擴增。

在CML發展期間,他們還發現IFN應答的ADAR1 p150亞型的表達增強,並且腺苷-肌苷的RNA編輯增加。

MicroRNA和非編碼RNA

MicroRNA(miRNA)的長度很短,大小集中在17bp-25bp之間,屬於非編碼RNA(ncRNA)家族的成員。

它們調控多種不同的生物學功能,包括發育、細胞增殖、細胞分化、信號轉導、凋亡、代謝和細胞壽命。

通過RNA-誘導沉默複合物(RISC)與轉錄本的3-UTR或者與編碼區中的識別位點相互作用。

miRNA的一個主要作用是抑制基因的轉錄後表達。

在多種癌症中,許多miRNA位於存在序列缺失刪除或擴增的基因組區域,這表明它們很可能在癌症的發展過程中扮演很重要的角色。

miRNA的編輯位點已經在近年來的研究中被發現了,表明RNA編輯和miRNA介導的調控之間可能存在著關聯。

同時由於miRNA的測定簡單、相對穩定,並且在大量mRNA的控制上起作用,這就讓miRNA成為癌症診斷以及治療期間的檢測和分期過程中極具吸引力的標誌物。

Law P. T., Qin H., Ching A. K., Lai K. P., Co N. N., et al. (2013) Deep sequencing of small RNA transcriptome reveals novel non-coding RNAs in hepatocellular carcinoma. J Hepatol 這篇文章描述了一種新的PIWI-互作RNA(piRNA)piR-Hep1,它參與了肝臟腫瘤發展。

與周圍正常肝臟相比,46.6%的肝癌細胞(HCC)存在piR-Hep1表達上調。

piR-Hep1的沉默抑制了細胞活力、運動和侵襲。

作者還發現miR-1323在HCC中的大量表達,以及它與肝硬化背景下所產生的腫瘤的獨特關聯。

實驗設計上的注意事項

測序深度與檢測靈敏度是直接相關的。

在典型的實驗中,如果測序流動槽(Flowcell)的一條通道(lane)只上一個樣本,那麼測序深度會非常高,這能實現極其靈敏的檢測。

基於此原因,miRNA的測序深度很少成為考慮因素。

在篩查應用中,或不需要如此高深度檢測的研究中,樣品可加上測序Index標籤,從而能夠在同一個測序lane中上樣多個不同的樣本。

需要注意的是,在設計miRNA的測序深度時,要時刻記住miRNA控制基因表達,因而miRNA水平的小變化可能影響許多編碼蛋白。

新發現的miRNA應當通過功能分析(如Ago2結合或敲除實驗)來確認。

實驗應當包含足夠的樣品,以便結論具有真正的統計意義和高的可信度。

一般來說,建立一個可能的假設相對來說是比較容易的,只要能證明miRNA存在於患者的腫瘤中,即便樣本數量不多也是足夠的。

但是要真正驗證假設就沒那麼容易了,通常需要大量的患者來檢驗,並建立統計學可信度。

目前,關於如何在測序研究中建立統計學可信度和多重檢驗糾正,還沒有特別公認的方法。

當前基於測序的miRNA分析並沒有實現miRNA表達的絕對定量,而僅是不同miRNA(如腫瘤-正常配對)的相對量。

樣品分層是癌症樣品的一個問題。

一個特定的癌症表型可能代表幾種不同的病因和機理。

為了要進行嚴格的分析,應當有足夠多的樣品量,從而能夠充分代表每個腫瘤亞型。

而miRNA的表達會隨著腫瘤的發展而變化,因此在實驗設計時應建立腫瘤分期和分級。

RNA-蛋白結合(CLIP-Seq)

在人類細胞中,大多數mRNA(或前體mRNA)與核不均一性核糖蛋白(hnRNP)相結合,形成大的hnRNP-RNA複合物。

hnRNA蛋白在RNA加工的所有關鍵環節中都發揮重要作用,包括前體mRNA剪接以及mRNA出核、定位、翻譯和穩定性。

幾十種RNA結合蛋白(RBP)和基因的hnRNP蛋白與癌症相關聯。

RNA-蛋白的相互作用可通過交聯免疫沉澱測序(CLIP-Seq)來測定。

在CLIP-Seq中,細胞經過紫外線處理,讓RBP與RNA複合物共價交聯。

細胞隨後被裂解,RBP-RNA複合物被免疫共沉澱,從而測序相應的RNA。

Wilbert M. L., Huelga S. C., Kapeli K., Stark T. J., Liang T. Y., et al. LIN28 binds messenger RNAs at GGAGA motifs and regulates splicing factor abundance. Mol Cell 48: 195-206 LIN28是個保守的RNA結合蛋白,它與多能性、重編程和腫瘤的形成相關。

在各種不同的癌細胞和原發腫瘤組織中都發現LIN28的異常上調。

在這篇文章中,作者利用CLIP-Seq鑑定了大約四分之一分布於人類轉錄本中LIN28的結合位點。

從這些結合位點中他們發現,LIN28與mRNA中富含環結構的GGAGA序列結合。

同時還發現了,LIN28的表達能夠導致可變剪切中的下游變化。

表觀遺傳和甲基化

癌症發展過程中的表觀遺傳改變與異常的基因表達相關聯。

近期的研究證據表明,表觀遺傳上的改變可能在癌症 起始中 發揮作用。

表觀遺傳的控制是通過多個不同過程進行介導的,包括DNA修飾(甲基化或乙醯化)、組蛋白修飾和核小體重塑。

發現控制表觀基因組的基因發生突變,在人類癌症中是一個相當普遍的現象。

NGS測序技術提供了一整套工具,可定位突變並測定它們對癌症發展的影響。

癌症中表觀遺傳修飾物的基因突變。

在不同類型的癌症中經常觀察到三類表觀遺傳修飾物發生突變,這突出了遺傳學和表觀遺傳學之間的串擾。

表觀遺傳修飾物的突變有可能引起癌症的全基因組表觀遺傳改變。

了解遺傳和表觀遺傳變化的關係將為癌症治療提供新的見解。

DNA修飾

DNA修飾目前可以很容易地通過多種技術來進行測定。

不同技術的選擇取決於所需的通量和解析度。

Bert S. A., Robinson M. D., Strbenac D., Statham A. L., Song J. Z., et al. Regional activation of the cancer genome by long-range epigenetic remodeling. Cancer Cell 23: 9-22 文章作者通過協同的長距離表觀遺傳激活(LREA)技術,鑑定出一種結構域基因去調控的機制。

這些區域通常會跨越1Mb的基因組長度,包括關鍵癌基因、microRNA和癌症的生物標誌物基因。

LREA結構域中基因啟動子的特點是活性染色體標記的的獲得和抑制標記的丟失。

Brastianos P. K., Horowitz P. M., Santagata S., Jones R. T., McKenna A., et al. Genomic sequencing of meningiomas identifies oncogenic SMO and AKT1 mutations. Nat Genet 45: 285-289 為了鑑定和驗證腦膜瘤中的體細胞遺傳改變,作者對17個腦膜瘤進行了全基因組或外顯子組測序,並對另外48個腫瘤進行了靶向測序。

他們所觀察到的突變譜是分布廣泛,但他們證實了43%的腫瘤中存在病灶NF2失活,並在另外8%的腫瘤中發現表觀遺傳修飾物的改變。

Duncan C. G., Barwick B. G., Jin G., Rago C., Kapoor-Vazirani P., et al. A heterozygous IDH1R132H/WT mutation induces genome-wide alterations in DNA methylation. Genome Res 22: 2339-2355 腦膠質瘤、急性骨髓性白血病和軟骨瘤中經常發生NADP+依賴的異檸檬酸脫氫酶IDH1和IDH2的單等位點基因點突變。

作者表明,IDH1R132H等位基因的雜合表達足以誘導這些腫瘤特有的以DNA甲基化為特徵的全基因組改變。

這說明了IDH1R132H/WT突變體是推動人類癌細胞的表觀遺傳不穩定性的原因。

Zhang J., Benavente C. A., McEvoy J., Flores-Otero J., Ding L., et al. A novel retinoblastoma therapy from genomic and epigenetic analyses. Nature 481: 329-334 視網膜母細胞瘤是一種發生於視網膜的侵襲性兒童癌症,由RB1失活所引發,但潛在機理仍然未知。

在此類高度侵襲性的癌症中,許多基因都參與其中,但RB1是唯一的已知發生突變的癌基因。

與有限的體細胞突變不同,相對正常的成視網膜細胞,腫瘤的甲基化圖譜表現出巨大的改變。

最驚人的結果之一是人視網膜母細胞瘤中原癌基因脾絡氨酸激酶(SYK)的誘導表達。

SYK是腫瘤細胞生存所必需的。

研究人員接著表明,小分子抑制劑對SYK的抑制導致培養和體內的視網膜母細胞瘤的細胞死亡。

實驗設計上的注意事項

每種組織和細胞類型都有著獨特的甲基化模式;因此必須獲得感興趣的組織以便分析。

癌症研究中,腫瘤組織-癌旁正常組織的配對可簡化分析。

通過重亞硝酸氫鹽測序所產生的超大量CpG標誌物很難解釋,且可靠的統計學分析目前仍然困難重重。

不過,下面一些實際的方法可簡化分析:

  • RRBS-Seq通過限制覆蓋度而簡化分析;

  • 綜合分析大大改善了結果的可解釋性。

    例如,將表達分析與甲基化分析相結合,讓我們可專注於表達水平改變的基因;

  • 將分析限制在某個感興趣的基因或區域中。

    這種方法對GWAS的後續研究很有效,也適合已有實驗證據說明目的區域存在基因調控或染色質重塑的研究。

    與降低代表性的方法不同。

    這種方法實現了更多區域的分析,因此可獲得更多信息。

組織培養物應當謹慎使用。

隨著時間的推移和組織增殖,培養物的甲基化水平可能已經改變,不大能代表原先的組織樣本。

組蛋白修飾

組蛋白修飾通常指的是甲基化和乙醯化。

組蛋白H3K9、H3K27和H4K20的甲基化與基因轉錄的抑制相關,而H3K4和H3K36的三甲基化與活性轉錄的染色質相關。

組蛋白乙醯化幾乎總是與染色質可接近性和轉錄活性水平的增高相關。

通過操控染色質狀態和DNA可接近性,表觀遺傳修飾在各個發育階段、組織類型和疾病中都對基因表達的控制起著關鍵作用。

Wilkinson A. C., Ballabio E., Geng H., North P., Tapia M., et al. (2013) RUNX1 is a key target in t(4;11) leukemias that contributes to gene activation through an AF4-MLL complex interaction. Cell Rep 3: 116-127 這篇文章報導了一種轉化機制,其中兩個致癌融合蛋白合作激活目的基因,然後調節其下游產物的功能。

實驗設計上的注意事項

每種組織和細胞類型都有著獨特的甲基化模式;因此必須獲得目的組織以便分析。

組蛋白修飾可以通過各種ChIP-Seq方法進行檢測,原理是通過抗體與目標甲基化組蛋白進行特異結合。

同樣,組織培養物應當謹慎使用。

隨著時間的推移和組織增殖,培養物的甲基化水平可能已經改變,不大能代表原先的組織樣本。

染色質結構與重排

染色體重排需要DNA雙鏈斷裂的形成和連接。

這些事件的發生,會破壞基因組的完整性,並經常在白血病、淋巴瘤和肉瘤中觀察到。

並且特定基因間的反覆的基因融合在不同的個體中均觀察到,這表明這些基因一定在細胞周期中的某個階段他們之間的物理位置非常接近。

這是一個設想的三維、具有轉錄活性的複合物,它包含了緻密的環化位置。

這個示意圖是基於檢測到的成環事件,並假設所有成環事件都能發生在單個細胞內。

在這個模型中,所有小環匯集到一個共同的核心(藍色球)。

環降低了轉錄活性複合物的物理大小,從而推動轉錄因子接近待定的基因組位點。

檢測染色質相互作用。

在三維空間中,相同或不同染色體上遠端的基因組區域相互作用,而這種相互作用是由一個或多個DNA結合蛋白介導的。

a) ChIP-Seq 利用染色質免疫共沉澱來鑑定DNA和蛋白的相互作用。

人們採用各種DNA-片段化方法和核酸外切酶,來縮小片段的大小分布。

b)染色質構像捕獲實驗利用一個連接步驟將互作的染色質片段相連接。

這種方法可鑑定與遙遠序列相結合的蛋白。

c)配對末端標籤測序分析染色質相互作用(ChIA-PET)同樣也利用連接步驟來檢測染色質相互作用,將不相鄰的互作區域配對。

然而,ChIA-PET利用染色質免疫共沉澱(ChIP)步驟,只能鑑定特定蛋白的相互作用,如RNA聚合酶II。

參考文獻

Papantonis A., Kohro T., Baboo S., Larkin J. D., Deng B., et al. TNFalpha signals through specialized factories where responsive coding and miRNA genes are transcribed. EMBO J 31: 4404- 4414 作者利用測序以及染色體構像捕獲(3C)和ChIA-PET表明,TNF_alpha誘導響應基因聚集在分散的『NF-B工廠』。

一些『工廠』還專門轉錄編碼miRNA的響應基因,這些miRNA靶定下調的mRNA。

Rocha P. P., Micsinai M., Kim J. R., Hewitt S. L., Souza P. P., et al. Close proximity to Igh is a contributing factor to AID-mediated translocations. Mol Cell 47: 873-885 細胞核組織可決定『脫靶』活性以及融合伴侶的選擇。

這項研究表明,絕大多數已知的活化誘導胞嘧啶核苷脫氨酶(AID)介導的Igh轉位伴侶在類型轉換過程中與此位點接觸的染色體結構中被發現。

此外,這些相互作用結構域可用來鑑定被AID靶定的其他基因。

Theodoratou E., Montazeri Z., Hawken S., Allum G. C., Gong J., et al. Systematic meta- analyses and field synopsis of genetic association studies in colorectal cancer. J Natl Cancer Inst 104: 1433-1457 這篇研究文章表明,T細胞特異的轉錄因子GATA3在介導增強子接近調控區域上扮演了重要角色,這些調控區域參與了雌激素受體(ESR1)介導的轉錄。

GATA3沉默導致在雌激素刺激之前輔助因子和活性組蛋白標記的整體重新分配。

Hakim O., Resch W., Yamane A., Klein I., Kieffer-Kwon K. R., et al. (2012) DNA damage defines sites of recurrent chromosomal translocations in B lymphocytes. Nature 484: 69-74 作者發現,在培養的小鼠B淋巴細胞中,缺乏經常性的DNA損傷時,Igh或Myc與其他所有基因之間的易位與它們的接觸頻率直接相關。

反過來,與經常性位點指向的DNA損傷相關的易位與DNA斷裂形成的速率成正比。

他們認為,非定向重排反映了細胞核結構,而DNA斷裂形成決定了包括驅動B細胞惡性腫瘤在內的經常性易位的位置和頻率。

綜合分析(多組學分析)

所有的生物過程都是相互關聯的,而在癌細胞發生過程的任何一個變化都會影響其他所有過程。

突變可能影響所表達的活性,繼而又影響DNA甲基化,再就影響其他許多基因的表達等等一連串的反應。

每個個體都有著大量的特有突變,再加上這一連串的事件,能夠讓人們深入研究各種用於區分癌症的疾病表型。

綜合分析可以使揭示癌症生物學的真正複雜性向前邁進了一步。

研究人員如今能夠檢測大部分的單個過程,但認識和治療癌症的真正進步將來自於對所有這些過程的綜合分析,也就是常說的多組學分析。

參考文獻

Weischenfeldt J., Simon R., Feuerbach L., Schlangen K., Weichenhan D., et al. (2013) Integrative genomic analyses reveal an androgen-driven somatic alteration landscape in early-onset prostate cancer. Cancer Cell 23: 159-170 作者發現,早發性攝護腺癌的形成涉及到雄激素驅動的結構重排。

相比之下,老年發病的攝護腺癌積累了非雄激素相關的結構重排,表明一種不同的腫瘤形成機制。

Cowper-Sal lari R., Zhang X., Wright J. B., Bailey S. D., Cole M. D., et al. (2012) Breast cancer risk- associated SNPs modulate the affinity of chromatin for FOXA1 and alter gene expression. Nat Genet 44: 1191-1198 作者表明,與乳腺癌風險相關的SNP集中在FOXA1和ESR1的順反組(cistrome),以及組蛋白H3賴氨酸4單甲基化(H3K4me1)的表觀基因組。

大多數的風險相關SNP調控FOXA1在遠端調控元件的染色質親和力,這導致等位基因特異的基因表達。

Peifer M., Fernandez-Cuesta L., Sos M. L., George J., Seidel D., et al. (2012) Integrative genome analyses identify key somatic driver mutations of small-cell lung cancer. Nat Genet 44: 1104-1110 作者發現了TP53和RB1失活的證據,並在編碼組蛋白修飾物的基因中發現了反覆的突變。

此外,他們還在PTEN、SLIT2和EPHA7中觀察到突變,以及FGFR1絡氨酸激酶基因的病灶擴增。

這種綜合分析表明,組蛋白修飾可能與小細胞肺癌(SCLC)有關。

技術參考

一個良好的實驗設計可以提高技術性能,從而產生最易解釋和可靠的結果。

這裡重點強調研究人員在設計實驗時必須牢記的生物學和技術的特性。

癌症中的實驗設計面臨一些獨特的挑戰。

典型的腫瘤樣本包含兩個基因組:遺傳自父母的生殖細胞系(germline)和在疾病發展過程中積累的體細胞突變(somatic mutations)。

腫瘤細胞在樣本中的比例可能在10%-100%之間。

腫瘤基因組也是動態的,會快速積累 de novo 突變。

因此,每一個腫瘤中又可能同時包含幾個克隆亞型。

目前大部分已發表研究的樣本量都非常小,可被視為僅是提出了相關的假說。

而隨著越來越多的測序信息被我們所獲得,大部分癌症類型可根據其分子表型,被分成多個亞群。

這嚴重降低了實驗的能力,並增加了嚴格分析所需的樣本數量。

部分解決這一難題的方案是在探索階段利用全基因組測序來尋找新的突變。

在第二階段,利用全外顯子組或靶向測序來確認新發現的這些突變,並確定他們在大型隊列中的豐度。

然而,在未來,統計學上嚴謹的全基因組測序實驗有可能是非常大的,需要數千個樣本。

使用NGS測序技術進行深度測序是指多次生成定位到同一區域的序列片段,有時達上百次。

但由於每條序列片段是從單個DNA分子中產生的,故提高深度測序能夠實現原始樣品中低至1%的克隆的檢測。

比較同一個體的腫瘤和癌旁正常組織的序列,我們可以很容易識別浸潤組織的序列片段。

最佳的讀取深度將取決於癌症類型和所需的靈敏度,但一般建議為正常基因組最低為40倍的覆蓋深度,而癌症基因組需要80倍以上的覆蓋深度。

在腫瘤高度異質時,可能需要腫瘤不同部位的多次活檢,才能包含所有的細胞類型。

在這個假定的例子中,腫瘤含有兩個癌症克隆和鄰近組織。

腫瘤樣本中正常細胞所產生的序列(圖中:比對中的前兩個序列)可通過與鄰近正常組織所產生的序列比較後確定。

腫瘤樣本中的剩餘序列可分為兩組,分別代表主要和次要的腫瘤克隆。

次要克隆,若不及時治療,可能在復發時成為腫瘤的主要組分。

在實際分析中,腫瘤樣本至少要有40倍的覆蓋深度,並覆蓋靶定的基因集合、全外顯子組或全基因組。

檢測癌症基因組中的體細胞突變通常有三種方法:全基因組測序、全外顯子組測序和靶向基因測序。

下表簡要介紹了每種方法的有點和缺點。

在比較多發性骨髓瘤的全基因組和外顯子組測序時,半數的蛋白編碼突變通過染色體畸變(如易位)而存在,其中大部分不能單獨被外顯子組測序而發現。

靶向重測序是一種有用的技術,可收錄超大隊列中已知癌症相關基因的突變。

從長遠來看,隨著我們對基因組的了解日益加深,並且我們處理和解釋大型數據集的能力的提高,全基因組測序無疑是最好的腫瘤分子鑑定方法。

而在短期內,靶向基因測序可為患者匹配出市場上已有的藥物,讓他們立刻受益。

參考來源

Illumina cancer research


請為這篇文章評分?


相關文章