基于ATAC-seq和RNA-seq預(yù)測(cè)子宮內(nèi)膜非典型增生和子宮內(nèi)膜樣癌患者黃體酮不敏感的潛在模型
子宮內(nèi)膜樣癌(EEC)是婦科最常見(jiàn)的惡性腫瘤之一,每年新發(fā)癌癥病例和死亡人數(shù)呈上升趨勢(shì)。值得注意的是,EEC及其癌前病變,子宮內(nèi)膜不典型增生(EAH)呈現(xiàn)出年輕化的趨勢(shì),大約一半的年輕EEC和EAH患者在確診時(shí)是未分娩的。因此,保留生育能力的治療在臨床研究中受到越來(lái)越多的關(guān)注。目前,大劑量孕激素治療是主要的保守治療策略,達(dá)到約70%-80%的完全緩解(CR)率。然而,仍有大約20%-30%的病例對(duì)孕激素不敏感。
目前尚缺乏預(yù)測(cè)EAH或EEC患者孕激素敏感性的客觀指標(biāo)。研究表明,孕激素受體(PR)在EAH和EEC組織中的陽(yáng)性表達(dá)與保留生育治療的CR時(shí)間較短有關(guān)。能用于預(yù)測(cè)EAH和EEC病例孕激素反應(yīng)的分子標(biāo)志物的高質(zhì)量證據(jù)較少。因此,仍然需要進(jìn)一步的研究來(lái)探索預(yù)測(cè)EAH和EEC患者孕激素反應(yīng)的有前景的模型。
為了構(gòu)建EAH或EEC患者孕激素敏感的潛在預(yù)測(cè)模型,該研究基于EAH和EEC組織的ATAC-seq和RNAseq數(shù)據(jù)的綜合生物信息學(xué)分析,確定了候選基因,并在另外35例病例中進(jìn)一步驗(yàn)證了預(yù)測(cè)模型。該研究提供了預(yù)測(cè)EAH和EEC患者孕激素不敏感的潛在模型。
結(jié)果:
1. ATAC-seq數(shù)據(jù)比較PIS與PS患者染色質(zhì)可及性
ATAC-seq分析基因組染色質(zhì)的可及性(PIS,n=7和PS,n=7)。每組中有5名患者同時(shí)有ATAC-seq和RNA-seq數(shù)據(jù)。每組中剩下的兩名患者分別只有ATAC-seq數(shù)據(jù)或RNA-seq數(shù)據(jù)。在ATAC-seq結(jié)果中,根據(jù)功能和位置信息,每個(gè)樣本中所有讀取的比例與人類(lèi)基因組中的元素相匹配。PIS組轉(zhuǎn)錄位點(diǎn)的可及性在啟動(dòng)子區(qū)域更為豐富,而PS組在內(nèi)含子和遠(yuǎn)端基因間隔區(qū)的可及性更豐富。PIS組比PS組有更多的開(kāi)放差示峰(圖1D)。通過(guò)系統(tǒng)聚類(lèi)分析,PIS組較PS組有2773個(gè)開(kāi)放峰和948個(gè)閉合峰(圖1E)。熱圖顯示,在PIS病例中,轉(zhuǎn)錄活躍的基因比例高于PS病例。每組6個(gè)樣本的基因峰按等級(jí)聚類(lèi)成一組,說(shuō)明了ATAC-seq數(shù)據(jù)的可靠性和準(zhǔn)確性。

2. 應(yīng)用RNA-seq技術(shù)比較PIS和PS的基因表達(dá)譜
為了比較PIS和PS的表達(dá)譜,通過(guò)層次聚類(lèi)分析顯示DEG(圖2A)。與PS組相比,PIS組有4349個(gè)上調(diào)的DEG和2102個(gè)下調(diào)的DEG(圖2B)。GO和REACTOME富集分析確定PIS組中上調(diào)和下調(diào)的DEG的功能(圖2,C-D)。
BP:PIS組下調(diào)的DEGS主要在中性粒細(xì)胞相關(guān)活性、高爾基囊泡轉(zhuǎn)運(yùn)、膜內(nèi)系統(tǒng)組織、巨噬細(xì)胞自噬和細(xì)胞對(duì)化學(xué)應(yīng)激的反應(yīng)中豐富,而PIS組上調(diào)的DEGS主要豐富于膜電位和突觸信號(hào)相關(guān)功能。
CC:PIS組下調(diào)的DEG主要集中在顆粒腔、囊腔、細(xì)胞-底物連接和局灶性粘連,而PIS組上調(diào)的DEG主要集中在突觸膜和相關(guān)的轉(zhuǎn)運(yùn)體。
MF:PIS組下調(diào)的DEGS富集在鈣粘素、核苷、GTP和泛素蛋白連接酶結(jié)合等,而PIS組上調(diào)的DEG富含通道、跨膜轉(zhuǎn)運(yùn)體和神經(jīng)遞質(zhì)受體活性。
REACTOME通路:PIS組下調(diào)的DEGS顯著豐富于天冬酰胺N-連接糖基化、中性粒細(xì)胞脫顆粒、自噬和高爾基體與內(nèi)質(zhì)網(wǎng)(ER)之間的轉(zhuǎn)運(yùn)等途徑,而PIS組上調(diào)的DEGS豐富于化學(xué)和突觸信號(hào)傳遞、成纖維細(xì)胞生長(zhǎng)因子受體(FGFR)和G蛋白偶聯(lián)受體(GPCR)。

3. ATAC-seq和RNA-seq整合的GO和REACTOME分析
為了進(jìn)一步確定與孕激素不敏感相關(guān)的特定功能和途徑,綜合ATAC-seq和RNA-seq結(jié)果進(jìn)行進(jìn)一步分析。通過(guò)重疊ATAC-seq和RNA-seq的結(jié)果,與PS組相比,PIS組在染色質(zhì)可及性方面具有138個(gè)上調(diào)的DEG和92個(gè)下調(diào)的DEG,其中染色質(zhì)可及性具有關(guān)閉的峰。相關(guān)分析表明,上述230個(gè)重疊區(qū)的表達(dá)譜與染色質(zhì)可及性呈顯著正相關(guān)(圖3 A,B)
為了進(jìn)一步了解這230個(gè)重疊的DEG是否參與了特定的功能和通路,我們進(jìn)行了GO注釋和REACTOME通路(圖3C-D)。
BP:PIS組中重疊下調(diào)的DEGS主要影響細(xì)胞的輸入運(yùn)輸、半胱氨酸型內(nèi)肽酶活性的負(fù)調(diào)節(jié)、對(duì)活性氧的反應(yīng)和脂肪細(xì)胞分化。
CC:PIS組中重疊下調(diào)的DEG位于谷氨酸能突觸、膜外成分、含膠原細(xì)胞外基質(zhì)和胞內(nèi)囊泡腔中,而PIS組中重疊上調(diào)的DEG位于糖蛋白復(fù)合體、鈉通道復(fù)合體、β-連環(huán)素-Tcf復(fù)合體和肌膜。
MF:PIS組中重疊下調(diào)的DEG在細(xì)胞外基質(zhì)結(jié)合、鈣粘附素結(jié)合、轉(zhuǎn)錄輔因子結(jié)合和磷脂酰絲氨酸結(jié)合中豐富,而在PIS組中上調(diào)的DEG與bHLH轉(zhuǎn)錄因子結(jié)合、β-連環(huán)蛋白結(jié)合和鈉通道活性相關(guān)。
REACTOME通路:PIS組中這些重疊下調(diào)的DEG主要影響MAPK家族信號(hào)級(jí)聯(lián)、第二信使的細(xì)胞內(nèi)信號(hào)轉(zhuǎn)導(dǎo)、PI3K/AKT網(wǎng)絡(luò)的負(fù)調(diào)控、G1中的細(xì)胞周期蛋白D相關(guān)事件以及FOXO?介導(dǎo)的細(xì)胞周期基因的轉(zhuǎn)錄;而PIS組中上調(diào)的DEG主要豐富于膽鹽和有機(jī)酸、金屬離子和胺化合物的運(yùn)輸、微管蛋白的羧基末端翻譯后修飾、參與巨核細(xì)胞發(fā)育和血小板生成的因子以及動(dòng)蛋白。
綜上所述,PIS組中重疊下調(diào)的DEGS主要負(fù)責(zé)信號(hào)傳遞、轉(zhuǎn)錄輔因子活性、DNA損傷、細(xì)胞凋亡和細(xì)胞周期,而PIS組中重疊上調(diào)的DEGS主要負(fù)責(zé)物質(zhì)轉(zhuǎn)運(yùn)和細(xì)胞骨架蛋白的調(diào)節(jié)。

4. 孕激素不敏感預(yù)測(cè)基因的篩選
為了進(jìn)一步篩選預(yù)測(cè)孕激素不敏感的候選基因,利用HOMER軟件對(duì)調(diào)節(jié)230個(gè)重疊DEG表達(dá)的潛在轉(zhuǎn)錄因子進(jìn)行了豐富。根據(jù)PIS組中69個(gè)下調(diào)的DEG,確定的TF包括CUX1、TBP、SOX5、FOXJ1、PRRX2、SOX9、FOXQ1、POU1F1、MECOM和NKX2-1,而根據(jù)PIS組中76個(gè)上調(diào)的DEG,僅識(shí)別出ZBTB18和CDC5L。此外,根據(jù)ATAC-seq和RNA-seq整合的結(jié)果,通過(guò)HOMER峰分析進(jìn)行了基序富集化。生成超過(guò)20%的具有富含染色質(zhì)區(qū)域的基序的靶序列的已知轉(zhuǎn)錄因子(PIS與PS)包括NANOG、TGIF2、NF1、HOXA9、FOXO1、SP2、SOX10、SOX3、TWIST2、SOX6、SOX21、KLF5、MAZ、TCF4、AP-1、BHLHA15R、NEUROG2、ATF3、SOX15和BATF。

此外,使用STRING和Cytoscape軟件分析了DEGS編碼的蛋白質(zhì)之間的相互作用(圖4B)。根據(jù)連接的品系越多綜合得分越高的原則,篩選出潛在的候選基因或中心基因。前四位連接4條以上蛋白質(zhì)分別由SOX9、CDH2、IRF4和TCF4編碼。PIS組下調(diào)區(qū)有8個(gè)蛋白質(zhì)有4條以上連接線,分別由CD44、ACTB、KLF4、APOE、SNAI2、FYN、PAX2和FOXO1編碼。25個(gè)候選基因(SYTL2、SOX5、DMD、TCF4、PDGFC、SOX9、BNC2、CDH2、BCL11A、ANKS1B、PPP2R2B、DIO2、IRF4、FGF19、FOXO1、GATA6、IRS2、CD44、APOE、KLF4、ACTB、FYN、CNTLN、HOXA9和RXRA)。
5. 預(yù)測(cè)孕激素不敏感的潛在模型的建立
為了建立準(zhǔn)確預(yù)測(cè)孕激素敏感狀態(tài)的模型,將35例患者進(jìn)一步分為PS-C組(n=13)、sub-PS-C組(n=15)和PIS-C組(n=7)(圖5)。首先,用RT-qPCR方法檢測(cè)這35例患者中25個(gè)候選基因的表達(dá)。由于SYTL2、ANKS1B、PPP2R2B和FGF19基因的CT值超過(guò)35,表明基因表達(dá)水平低,分析不準(zhǔn)確,因此這4個(gè)基因不包括在后續(xù)的分析中。

根據(jù)不同孕激素敏感條件,對(duì)其余21個(gè)基因的歸一化ΔCT值進(jìn)行多項(xiàng)Logistic回歸分析,建立預(yù)測(cè)模型。圖6的結(jié)果顯示,對(duì)于PIS-C患者,總共生成了25個(gè)預(yù)測(cè)模型,預(yù)測(cè)準(zhǔn)確率為100%,其中11個(gè)模型對(duì)于亞PS-C預(yù)測(cè)的預(yù)測(cè)準(zhǔn)確率超過(guò)80%(P<0.01)。有3個(gè)模型的總體預(yù)測(cè)準(zhǔn)確率超過(guò)90%,涉及9個(gè)候選基因(FOXO1、IRS2、PDGFC、DIO2、SOX9、BCL11A、APOE、FYN和KLF4)。

總結(jié):
ATAC-seq和RNA-seq整合分析共獲得230個(gè)重疊的差異表達(dá)基因。進(jìn)一步,基于GO分析、反應(yīng)途徑、轉(zhuǎn)錄因子預(yù)測(cè)、基序豐富、細(xì)胞角蛋白分析,確定了25個(gè)可能與孕激素不敏感相關(guān)的候選基因。最后,使用擴(kuò)展樣本進(jìn)行數(shù)據(jù)驗(yàn)證,并基于這些數(shù)據(jù)建立了包含9個(gè)基因(FOXO1、IRS2、PDGFC、DIO2、SOX9、BCL11A、APOE、FYN和KLF4)的預(yù)測(cè)模型,總體預(yù)測(cè)準(zhǔn)確率在90%以上。這項(xiàng)研究提供了潛在的預(yù)測(cè)模型,可能有助于在保留生育能力的治療之前識(shí)別孕激素不敏感的EAH和EEC患者。