人類癌癥中增強子甲基化與轉錄因子調控的極限拉扯
作為連接表觀基因組改變與基因表達變化橋梁的增強子,其甲基化與增強子轉錄、靶基因表達之間的調控關系與人類癌癥有著怎樣的愛恨情仇?今年6月初發表于《Oncogene》(IF:8.756)的一篇文章則刻畫了人類泛癌中增強子甲基化-增強子轉錄-靶基因表達三元組間的調控模式,其中強調了增強子甲基化驅動的核心轉錄因子調控回路,這種回路的重連可以作為藥物靶點和預后風險標志物。

一、研究背景
越來越多的證據表明,增強子甲基化對基因表達具有強大的動態調控作用。某些轉錄因子可以通過前饋的方式進行自調節和交叉調節,并與其增強子協同形成核心轉錄調控回路(CRC)。然而,研究人員對于增強子甲基化和核心轉錄調控回路之間的詳細調控機制的了解只是冰山一角。
二、研究思路
本研究整合公共的TCGA癌癥樣本與正常樣本的基因表達、DNA甲基化以及增強子轉錄等數據,從以下五個方面開展研究:增強子轉錄刻畫、DNA甲基化對增強子轉錄的影響、差異甲基化增強子、增強子甲基化-增強子轉錄-靶基因表達三元組調控模式、增強子甲基化驅動的核心轉錄調控回路。

三、研究結果
1、增強子甲基化在其轉錄活性調控中起著重要作用
基于在33種TCGA癌癥類型中鑒定得到的12559個轉錄增強子,作者利用Jaccard系數探究組織或者癌癥類型間增強子的轉錄組相似性,發現具有相似組織起源的癌癥譜系聚集在一起,表明增強子轉錄通常具有組織特異性(圖1 A)。作者隨后識別差異的增強子,并根據其從正常到癌癥的轉錄改變劃分為兩類:“升高”與“降低”。在識別的9131個差異增強子中,大多數的增強子都是癌癥類型特異的(圖1 B)。
進一步,該研究探究DNA甲基化對于增強子基礎轉錄的影響。作者識別增強子甲基化區域以及進一步篩選差異的甲基化增強子(癌癥vs 正常),并根據從正常到癌癥的甲基化改變將其劃分為“去甲基化”、“重新”以及“增強”。結果發現“去甲基化”的增強子在多種癌癥類型中占比50%以上(圖1C),而且大多數的增強子只在一種或兩種癌癥中存在差異甲基化(圖1 D)。在大多數的癌癥類型中,增強子的甲基化程度與其轉錄活性顯著負相關(圖1 E),也即大約76.5%的增強子其甲基化程度降低而轉錄水平增高(“去甲基化-升高”)。這些結果表明DNA甲基化是調控癌癥特異性增強子轉錄活性的重要因素,其中與增強子轉錄活性增加相關的去甲基化在人類癌癥中廣泛存在。

圖1、人類癌癥中增強子的轉錄與甲基化
2、人類癌癥中低甲基化增強子的全局激活
為了了解不同癌癥類型中增強子轉錄和甲基化的多樣性和普遍性,作者分別基于增強子的轉錄和甲基化水平對10種癌癥類型的4296個癌癥樣本進行了一致性聚類分析。基于增強子轉錄將樣本聚成了4個轉錄亞型(T1,T2,T3以及T4),這4個亞型中增強子轉錄的平均水平都顯著高于正常樣本,表明了增強子轉錄可能在癌癥中被全局激活(圖2 A,B)。隨后,基于增強子甲基化對相同的樣本進行聚類導致了4個甲基化亞型(M1,M2,M3以及M4),其中M1的甲基化水平與正常樣本相似,并且顯著高于M2、M3與M4(圖2 C,D)。因此,作者將M1亞型命名為“正常樣甲基化”亞型,而M2、M3與M4定義為“低甲基化”。
此外,作者基于累積超幾何分布利用甲基化亞型豐富樣本的轉錄亞型,綜合定義了6個樣本亞群(cluster A-F)(圖2 E)。據此,癌癥中增強子呈現兩種狀態:“低甲基化-激活的轉錄”(cluster A,B,C,D以及F,占總樣本的70.5%);“正常樣甲基化-激活的轉錄”(cluster E,占總樣本的70.5%)。BRCA與PRAD主要表現為“正常樣甲基化-激活的轉錄”增強子狀態,而COADREAD,HNSC、LIHC、LUAD、LUSC、KIRC、KIRP和THCA主要表現為“低甲基化-激活的轉錄”的增強子狀態(圖2 F)。這些結果表明低甲基化增強子的全局激活在人類癌癥中是一種常見的現象。

圖2、癌癥樣本中低甲基化增強子的全局激活
3、增強子的甲基化改變涉及復雜的基因表達調控模式
為了進一步闡述增強子甲基化相關的調控關系,作者系統性地識別了增強子擾動的靶基因(蛋白編碼基因與lncRNAs)以及進一步組裝了增強子甲基化三元組(增強子甲基化-增強子轉錄-靶基因表達)。在三元組中,去甲基化誘導增強子的激活從而上調靶基因表達(“去甲基化”-“升高”-“上調”)的調控關系占比最高(圖3A)。其中在LUAD中觀測到一個去甲基化的增強子(chr12: 31,902,03 -31,903,126)可以激活增強子基礎轉錄,上調lncRNA DENND5B-AS1的表達,該調控關系進一步在組織水平測序數據以及A549細胞中被驗證(圖3 B)。DENND5B-AS1共表達基因的功能富集分析結果顯示該基因參與DNA損傷修復,而轉錄因子FOXA1在已有研究中被證實通過誘導DNA去甲基化參與DNA損傷修復機制。確實,在A549細胞中DENND5B-AS1啟動子和增強子區域中觀測到明顯的FOXA1結合峰(圖3C)和染色質相互作用。此外,在LUAD中FOXA1表達與增強子的甲基化水平顯著負相關(圖3D)。實驗驗證表明FOXA1敲除后,MCF-7細胞中增強子甲基化水平明顯恢復(圖3E)。這些結果暗示轉錄因子在主導增強子調控中起到重要的作用。

圖3、推斷人類癌癥中增強子甲基化主導的調控模式
隨后,作者提出了四種以增強子甲基化為主的調控模式,以闡明三元組中可能的調控關系:“獨立”,“級聯”,“協同”,以及“復合”模式(圖3F)。獨立模式表明DNA甲基化獨立調控增強子的基礎轉錄和靶基因的表達,其中包括三個子模式:(1)轉錄因子和染色質重塑復合物綁定誘導的去甲基化促進了增強子的基礎轉錄,將增強子從平衡狀態切換到激活狀態(“靜態”模式);(2)激活狀態增強子的去甲基化增加了轉錄因子結合概率并影響靶基因的表達(“直接”模式);(3)增強子轉錄和靶基因都可能對DNA甲基化改變做出響應(“共響應”模式)。級聯模式則假設增強子甲基化可以調控其基礎轉錄產生增強子RNA(eRNA),而新生的eRNAs將構成轉錄起始復合物調控靶基因表達程序。在協同模式中,增強子甲基化和eRNA協同調控靶基因的表達。最后,復合模式則表示增強子甲基化及其所產生的eRNA共同影響靶基因的表達。
其次,作者進一步基于貝葉斯網絡與最大似然估計方法來識別每個三元組其數據擬合的調控模式,結果包括3212個“獨立”模式,951個“級聯”模式,766個“協同模式”以及47個“復合”模式(圖3 G)。有趣的是,基于靶基因的功能富集分析結果顯示“級聯”模式主要富集于免疫反應和發育以及分化;“協同”模式主要富集于細胞周期與信號通路功能術語;“獨立”模式主要參與RNA穩定性調節與生殖細胞發育的生物過程(圖3 H)。這些結果進一步強調了增強子甲基化驅動癌癥進展的可能影響。

圖3、推斷人類癌癥中增強子甲基化主導的調控模式
4、核心轉錄因子能夠塑造增強子甲基化并形成核心轉錄調控回路
先前的研究表明一些轉錄因子的占用可以介導調控元件上DNA甲基化的主動轉換。因此,作者調查幾個能夠修飾DNA甲基化的轉錄因子(MeTFs)對增強子甲基化的影響,例如轉錄因子RUNX3,CEBPB, CEBPA, GATA2, SOX2以及 FOXA1。這些在癌癥中顯著表達失調的MeTFs不僅在多個癌癥細胞系中觀測到其在增強子甲基化區域上表現出很強的結合信號,而且其表達與增強子甲基化水平顯著相關(圖4A),暗示了轉錄因子與增強子甲基化間存在緊密的聯系。例如,轉錄因子CEBPB能夠結合其增強子區域來調節自身的表達程序(圖4B),體外實驗已經證明CEBPB可以通過誘導增強子甲基化的改變進行自我調節,從而導致其在癌癥中的表達失調。在以往的研究中,這種轉錄因子自我調節回路也被稱為核心轉錄調控回路(CRC)。
為了進一步探索增強子甲基化對人類癌癥CRC的影響,作者系統地識別了增強子甲基化驅動的CRC (emCRCs):首先識別增強子甲基化區域內的超級增強子以及癌癥特異的核心轉錄因子;然后將含有核心轉錄因子的增強子甲基化三元組定義為是emCRCs;最終識別到33個自調控的核心轉錄因子,涉及48個emCRCs。在TAMR與WS8細胞中GRHL2在超級增強子與啟動子區域上的結合信號支撐了GRHL2可以導致自調控回路(圖4C)。此外,TEAD4的過表達可以被下游超級增強子 (chr12:3,068,563-3,070,563)的去甲基化所調控,形成正反饋循環。值得注意的是,與正常細胞相比HCT116細胞的超級增強子區有更強的TEAD4結合信號(圖4 C)。作者進一步探究前人研究中實驗支持的emCRCs下游基因,結果表明emCRC轉錄因子能夠調控彼此的表達,從而形成一個緊密相連的調控網絡(圖4 D)。通過注釋這些下游基因的功能,結果發現它們參與了癌癥進展的多種生物學過程,例如癌癥通路,免疫反應,染色質構成,細胞周期以及蛋白質修飾(圖4E)。這些結果表明,emCRCs對調控轉錄重編程和控制癌癥過程至關重要。

圖4、轉錄因子參與增強子甲基化調控
5、emCRC的重連接是潛在的治療靶點
作者進一步探究emCRCs在人類癌癥中的臨床應用價值。相比于emCRC中單個的增強子甲基化、增強子轉錄或者轉錄因子表達,基于COX多元回歸計算的各emCRC的風險得分具有最高的預后價值(圖5A)。例如,受其自身增強子甲基化調控的核心轉錄因子E2F8構成的emCRC在LIHC, LUAD,以及LUSC具有最高的預后價值(圖5B)。增強子(chr11:2,225,980 -2,227,103)的去甲基化激活增強子基礎轉錄并上調E2F8的轉錄。據此,作者通過免疫組化(IHC)和免疫熒光(IF)染色觀察到癌癥組織中E2F8蛋白水平高于正常組織(圖5 C,D)。E2F8相關的emCRC的風險得分在LUAD以及LIHC中可以作為風險預后標志物(圖5 E)。
在COADREAD, HNSC以及LUAD中核心轉錄因子ZNF384的上調可以被可以被下游增強子(chr12:13,024,869-13,025,992)的去甲基化所誘導(圖5F)。IHC和IF染色也支持結腸癌組織中具有較高的ZNF384蛋白水平(圖5G, H)。通過靶向ZNF384的CRISPR干擾處理,在K562細胞中觀察到其增強子基礎轉錄顯著降低(圖5I),暗示轉錄因子ZNF384可以調控其增強子活性。此外,在HNSC中基于ZNF384相關emCRC定義的風險得分則指示較差的疾病特異生存DSS(圖5J)。這些結果表明,emCRC的重連接可以增強ZNF384的表達,而上調ZNF384也可以通過調節其增強子活性形成一個正向的自調控環。

圖5、emCRCs的潛在臨床應用
6、EmethCRC:用于探索人類癌癥中的emCRC的網站服務器
EmethCRC (http://bio-bigdata.tech/EmethCRC/)包含癌癥特異的emCRCs和它們的調控關系、emCRCs的潛在臨床應用以及實驗支撐的emCRCs下游基因。所有結果均可免費下載用于后續分析。
四、小結
文章所有章節都是采用整體描述結合特例分析的手法,全局基調則從增強子甲基化-增強子轉錄-靶基因表達三元組中逐漸聚焦到增強子甲基化驅動的核心調控回路,最后以核心調控回路的整體動態變化相比于單個元素更能指示癌癥的生存完美收官。