發(fā)布日期:2017-08-25
在周五的《科學(xué)》雜志上,來自瑞典皇家理工學(xué)院等機(jī)構(gòu)的研究人員發(fā)布了一個(gè)“人類癌癥病理圖譜(Human Pathology Atlas)”,他們通過對(duì)近8000名患者的數(shù)據(jù)進(jìn)行分析,總結(jié)出了17種常見癌癥中,全部蛋白編碼基因表達(dá)的情況如何影響不同癌癥患者的預(yù)后及生存[1]。
他們建立起來的圖譜包含超過90萬條可預(yù)測(cè)患者生存期的生存曲線和500萬幅病理學(xué)圖像,通過現(xiàn)有的數(shù)據(jù),他們可以為患者生成個(gè)性化的模型,預(yù)測(cè)蛋白水平和腫瘤代謝的變化會(huì)怎樣影響腫瘤的發(fā)展,好進(jìn)行有針對(duì)性的治療,改善患者預(yù)后,延長(zhǎng)患者的生存期。在癌癥患者個(gè)性化治療這條“夢(mèng)想大道”上,科學(xué)家們又邁出了重要一步。
研究的通訊作者是瑞典皇家理工學(xué)院的Mathias Uhlén教授,他是歐洲生物技術(shù)聯(lián)合會(huì)的主席,也是人類蛋白質(zhì)圖譜項(xiàng)目(Human Protein Atlas,HPA)的領(lǐng)導(dǎo)者[2]。Uhlén教授將這次“癌癥病理圖譜”中的數(shù)據(jù)放在了http://www.proteinatlas.org/pathology網(wǎng)站上,可供其他研究人員和患者獲取。
Mathias Uhlén教授
在過去的十幾年里,科學(xué)家們做了大量的工作,建立了癌癥基因組圖譜(TCGA)、人類蛋白質(zhì)圖譜(HPA)等等,加速了我們對(duì)癌癥的整體了解。在這次的研究開始前,研究人員首先從TCGA數(shù)據(jù)庫中提取了11000名癌癥患者中9666人的轉(zhuǎn)錄組和臨床數(shù)據(jù),共覆蓋33個(gè)癌種。他們分析了這33種癌癥中的所有蛋白質(zhì)編碼基因(19571個(gè))的表達(dá)水平,同時(shí)也分析了它們?cè)贖PA項(xiàng)目中162名健康志愿者的37種正常組織中的表達(dá)。
研究人員發(fā)現(xiàn),有5000多個(gè)基因在癌癥患者和正常組織中都表達(dá),還有2000多種基因在癌癥患者中表達(dá)但在正常組織中受到限制,它們大多能夠調(diào)控DNA的復(fù)制、細(xì)胞凋亡以及有絲分裂。
接下來,研究人員在這33種癌癥中選擇了17種常見癌癥,包括7932例腫瘤樣本。他們發(fā)現(xiàn),患同一種癌癥的患者基因表達(dá)的個(gè)體差異很大,而總體來看,17種癌癥的基因表達(dá)又有很大的重疊。這意味著對(duì)于一些患者來說,他們的基因表達(dá)有可能會(huì)更加貼近于其他類型的癌癥,而不是本身所患的癌癥,這對(duì)于靶向治療具有一定的指導(dǎo)意義。但是唯獨(dú)肝癌是個(gè)例外,它與其他類型的癌癥幾乎沒有重疊,有著相對(duì)獨(dú)特的表達(dá)。
不同癌癥基因表達(dá)的重疊情況,左上灰色就是肝癌
研究人員對(duì)每個(gè)患者的生存時(shí)間等臨床數(shù)據(jù)和基因組數(shù)據(jù)進(jìn)行了Kaplan-Meier生存分析,得到了單個(gè)或是多個(gè)基因表達(dá)水平高低與生存期之間的關(guān)系,以此來鑒定“預(yù)后基因”。17種癌癥和19571個(gè)蛋白編碼基因共產(chǎn)生了1億多個(gè)Kaplan-Meier分析圖,最終根據(jù)分析圖的結(jié)果將這些基因分為了有利于預(yù)后(高表達(dá)與更長(zhǎng)的生存期有關(guān))和不利于預(yù)后(高表達(dá)與更短的生存期有關(guān))的基因。
不同的癌癥類型中,有利和不利的基因比例也不同。值得注意的是,有2375個(gè)基因在不同的癌癥中對(duì)預(yù)后的作用是相反的,這也表明對(duì)預(yù)后基因表達(dá)的蛋白的功能研究是非常必要的。在這些預(yù)后基因中,只有少數(shù)已經(jīng)在過去的研究中被證明有預(yù)測(cè)患者預(yù)后的價(jià)值,比如與結(jié)直腸癌生存率有關(guān)的RBM3基因[3]。
但是大多數(shù)基因都是以前沒有被研究或重視的,通過這次的成果,相關(guān)領(lǐng)域的研究人員也可以有針對(duì)性的對(duì)一些基因開展研究,探究它們究竟是發(fā)揮主導(dǎo)作用還是只是隨著其他的基因表達(dá)變化而變化。
但是如果想要應(yīng)用于臨床的話,一次性分析一萬多個(gè)基因是不太現(xiàn)實(shí)的,因此研究人員建議可以選擇每種癌癥中影響最大的5個(gè)有利基因和5個(gè)不利基因,通過它們也能進(jìn)行生存分析,做臨床預(yù)測(cè)。
在17種癌癥中,對(duì)于本身3年生存率很高的癌癥(睪丸癌和前列腺癌,都超過了95%),鑒定出的預(yù)后基因是相對(duì)較少的,可能是由于患者的生存期差異不大,因此還需要更大隊(duì)列的研究才能確定更多的預(yù)后基因。既然有少的,那就一定有多的,肝癌和腎癌就是其中“翹楚”,它們分別有2892和6070個(gè)預(yù)后基因,其他癌癥最多也沒有超過2000。而其中腎癌的2892個(gè)預(yù)后基因中,有2629個(gè)都是不利預(yù)后的,比例高的驚人。
不同癌癥預(yù)后基因的數(shù)量(橫線上下數(shù)量尺不同哦)
研究人員又檢查了不同癌癥類型之間預(yù)后基因的重疊情況,對(duì)于大多數(shù)癌癥來說,它們“共享”的預(yù)后基因都不多,而且沒有一個(gè)基因被7種以上的癌癥共享。在有利預(yù)后基因中,只有肝、腎、肺和胰腺癌的顯著重疊,而不利預(yù)后基因中,則是腎、乳腺、肺和胰腺癌的重疊較為明顯。
研究人員發(fā)現(xiàn),不利于預(yù)后的基因大多都和細(xì)胞增殖有關(guān),包括有絲分裂、細(xì)胞周期調(diào)控等。他們單獨(dú)研究了與細(xì)胞周期調(diào)控有關(guān)的314個(gè)基因,其中194個(gè)(62%)的基因都屬于不利基因,至少在一種癌癥中有表達(dá)量的增加。然而這些基因在不同癌癥間共享的不多,這說明雖然它們雖然都是不利預(yù)后的基因,但是靶向同一個(gè)在不同的癌癥中效果是不同的。
以肝癌為例,和其他癌癥共享(淺橘色)或是獨(dú)有的(玫粉色)不利預(yù)后的調(diào)控細(xì)胞代謝的基因
研究人員進(jìn)一步分析了與總體高生存率相關(guān)的高表達(dá)基因,這些有利預(yù)后基因大多被認(rèn)為在正常組織中高表達(dá),而在腫瘤組織中表達(dá)減少。仍然以肝癌為例,研究人員發(fā)現(xiàn)66%的在正常肝臟組織中高表達(dá)的基因在肝癌患者或是肝癌細(xì)胞系中表達(dá)下降,而它們的表達(dá)量與腫瘤的分級(jí)呈負(fù)相關(guān)。
按照目前常用的三級(jí)分級(jí)法,腫瘤以分化程度被分為G1-高分化、G2-中分化和G3-低分化,腫瘤的分級(jí)越高,分化程度越低,惡性程度越高,生長(zhǎng)越快,預(yù)后越差。而這次的分類結(jié)果則顯示,這些組織高表達(dá)基因表達(dá)量越高,患者的預(yù)后越好,這與腫瘤分化等級(jí)越高,患者預(yù)后越差、存活率越低的已知概念相匹配。
研究人員還做了一些抗體的檢測(cè),他們發(fā)現(xiàn)這些抗體的量也可以作為預(yù)測(cè)預(yù)后的因素之一。比如癌癥睪丸抗原在多個(gè)類型的癌癥中表達(dá),而在正常情況下中,它只會(huì)出現(xiàn)在免疫豁免部位,比如睪丸和胎盤。再次以肝癌為例,研究人員對(duì)正常肝臟、肝癌患者的活檢組織和肝癌細(xì)胞系中的睪丸抗原表達(dá)做了檢測(cè),發(fā)現(xiàn)肝癌患者的活檢組織和肝癌細(xì)胞系中的表達(dá)量遠(yuǎn)遠(yuǎn)高于正常肝臟。
除了這些外,研究人員還將這次的數(shù)據(jù)和以前所用的基因組規(guī)模代謝網(wǎng)絡(luò)模型(GSMM,包含代謝物、基因和代謝中的生化反應(yīng),可以分析代謝,預(yù)測(cè)生長(zhǎng)情況)結(jié)合,為這次研究中的每個(gè)樣本建立了個(gè)體化的GSMM?;谶@個(gè)模型,研究人員可以研究腫瘤的代謝,分析不同的代謝條件下腫瘤的生長(zhǎng)速度,發(fā)現(xiàn)增加生長(zhǎng)速度的物質(zhì),找到產(chǎn)生它所需的酶,通過控制酶的編碼基因來控制腫瘤的生長(zhǎng)。
每個(gè)樣本個(gè)體化GSMM的建立思路
最終,研究人員確定了2553種必需基因,可以抑制或殺死腫瘤,其中55個(gè)是在患者體內(nèi)常見的。但是在這些必需基因中,絕大多數(shù)同時(shí)也影響著正常組織的代謝,當(dāng)進(jìn)行靶向測(cè)試時(shí),正常的組織也受到了不小的傷害,這如果是在人體內(nèi),就會(huì)產(chǎn)生相應(yīng)的副作用,因此這些必需基因?qū)?yīng)的蛋白質(zhì)不適合作為藥物開發(fā)的靶點(diǎn)。
不過,研究人員也預(yù)測(cè),參與癌細(xì)胞核苷酸代謝的32個(gè)基因被靶向時(shí),對(duì)健康組織是沒有太大毒副作用的,所以,它們倒是有可能成為潛在的治療靶點(diǎn)。這個(gè)模型的建立和分析是患者進(jìn)行個(gè)性化治療的一個(gè)途徑。
研究人員在一組非小細(xì)胞肺癌患者(357人)和一組結(jié)腸癌患者(60人)中驗(yàn)證了他們發(fā)現(xiàn)的預(yù)后基因是否“靠譜”。在肺癌患者中,他們確定的100個(gè)影響最大的預(yù)后基因與從TCGA數(shù)據(jù)庫中得到的有高達(dá)74%的重疊。研究人員進(jìn)一步從中選擇了8個(gè),對(duì)它們的表達(dá)進(jìn)行了分析,結(jié)果顯示它們的表達(dá)水平與預(yù)后結(jié)果確實(shí)顯著相關(guān)。結(jié)腸癌患者中的實(shí)驗(yàn)也得到了類似結(jié)果,他們篩選出的6個(gè)基因的蛋白質(zhì)表達(dá)水平也全部與預(yù)后相關(guān)。
Uhlén教授表示:“這項(xiàng)研究與之前的類似研究不同,它不是將注意力集中在與癌癥有關(guān)的突變上,而是所有的蛋白質(zhì)編碼基因的突變對(duì)下游的影響,我們首次展示了在大數(shù)據(jù)層面,基因表達(dá)水平的影響將如何改變醫(yī)學(xué)研究。我們很高興為全世界的癌癥研究人員提供了免費(fèi)開放獲取的資源庫,希望這有助于加快找到個(gè)性化癌癥治療所需的生物標(biāo)志物。”[4]
參考資料
[1] http://science.sciencemag.org/content/357/6352/eaan2507.full
[2] https://www.kth.se/en/bio/research/proteomics/proteomics-researchers/mathias-uhlen-1.67763
[3] Hjelm B, Brennan D J, Zendehrokh N, et al. High nuclear RBM3 expression is associated with an improved prognosis in colorectal cancer[J]. PROTEOMICS-Clinical Applications, 2011, 5(11‐12): 624-635.
[4] https://www.sciencedaily.com/releases/2017/08/170817141728.htm
來源:奇點(diǎn)網(wǎng)(微信號(hào) geekheal_com)