膠質瘤是最常見的原發性腦腫瘤,起源于中樞神經系統(CNS)內的神經膠質細胞,患者的中位生存期僅在12到15個月之間,因此,需要發現更有效的治療方法來改善病人的預后。小編今天和大家分享一篇今年六月剛剛發表在Journal of Translational Medicine(IF:5.531)雜志上的關于膠質瘤預后的純生信分析文章。文章聚焦小神經膠質細胞,收集多個平臺的數據,對小神經膠質細胞基因及功能進行了分析,主要使用的方法包括差異表達分析,功能富集分析,隨機游走,及生存分析在內的生信常用方法,文章簡單易懂,邏輯清晰,感興趣的小伙伴不要錯過呀。
Comprehensive analysis of microglia gene and subpathway signatures for glioma prognosis and drug screening: linking microglia to glioma
膠質瘤預后和藥物篩選相關的小神經膠質細胞基因和子通路特征綜合分析:小神經膠質細胞與膠質瘤的關聯
一.摘要
膠質瘤是大腦中最常見的惡性腫瘤。以往研究表明,小神經膠質細胞作為神經系統中的先天免疫細胞,參與了膠質瘤的病理過程。研究整合多個平臺的公共數據資源,分析了膠質瘤內小神經膠質細胞的特異性生物學特征,揭示了膠質瘤小神經膠質細胞與膠質瘤巨噬細胞比較(MicT/MacT)和膠質瘤小神經膠質細胞與正常小神經膠質細胞比較(MicT/ MicN)兩種情況下的生物學特征。識別出9個核心MicT/MicN基因,它們與膠質瘤的復發和預后密切相關。此外,研究也基于隨機游走策略識別出小神經膠質細胞特異性子通路,并開發了用于膠質瘤預后分析的SubP28特征。文章還分析了膠質母細胞瘤 (GBM)和低階膠質瘤(LGG)中小神經膠質細胞M1/M2極化與SuP28特征之間的關系。最后,研究建立了一個全面的藥物-子通路網絡,用于篩選候選的治療分子。總之,文章通過大規模數據集,分析小神經膠質細胞相關基因和功能,建立了一個框架對小神經膠質細胞和膠質瘤之間的內在聯系進行了解析。
二.背景
研究發現膠質瘤微環境由多種非腫瘤細胞組成,這些細胞在腫瘤生長、進展、免疫反應逃避等方面發揮著重要作用。其中小神經膠質細胞是中樞神經系統的常駐巨噬細胞,分布于整個大腦,其功能包括調節免疫反應,支持神經元的穩態,維持血腦屏障(BBB)的完整性等。研究發現在健康的大腦中,小神經膠質細胞的周轉很少,然而,血液中的巨噬細胞卻表現出很高的周轉率。雖然這兩個免疫細胞亞群是腦免疫系統的主要組成部分,但在腦病理中觀察到小神經膠質細胞和外周巨噬細胞具有不同的功能。此外,GBM腫瘤中報道了這兩種巨噬細胞群的相反作用。不過小神經膠質細胞和巨噬細胞之間的生物學差異,以及細胞特異性參與膠質瘤事件還有待于進一步刻畫。
三.數據及方法
1. 基因表達數據集:研究從GEO數據庫中收集膠質瘤患者腦組織中的小神經膠質細胞和巨噬細胞基因表達數據。所用數據集為GSE65868、GSE86573和GSE80338,其中疾病狀態和細胞數量均來自以往的研究。其中GSE86573數據集不考慮血液組織,將腦組織作為正常樣本,GSE80338數據將癲癇和死后標本作為正常標本。此外,作者為了研究小神經膠質細胞基因及功能特征在膠質瘤病理中的生物學作用,從GEO、TCGA、Chinese glioma Genome Atlas (CGGA)和Pan-Cancer Analysis of Whole Genom(PCAWG)數據庫中獲取了包含膠質瘤臨床信息的大量基因表達數據集。最終共納入26組數據集。這些數據集包含3種膠質瘤事件,包括膠質瘤和正常樣本、復發和原發樣本以及有預后信息的樣本。
2. 差異表達分析:研究利用兩種方法分別對RNA序列和芯片數據集進行差異表達分析。對于RNA序列數據集(GSE86573和GSE80338),利用R包 DEseq2根據原始計數矩陣識別差異表達基因。對于芯片數據集(GSE65868),作者結合差異倍數和t檢驗,基于FPKM表達矩陣識別差異表達基因。
3. 小神經膠質細胞特異性基因的功能探索:研究基于MicroT/MacroT數據集和MicroT/ MicroN數據集共享的一致差異表達基因,進一步使用R包 clusterProfler進行功能富集分析,考慮了GO生物過程(BP)。同時,從分子特征數據庫(MsigDB)中獲取腫瘤hallmarkers基因集進行功能關聯分析。采用超幾何檢驗評估一致基因與已知hallmarkers之間的相關性。
4. 新的識別小神經膠質細胞特異性子通路框架:為了從功能層面探索小神經膠質細胞的生物學作用,作者開發了一個新的框架來識別小神經膠質細胞特異性子通路。研究將MicT/ MacT組的2個數據集及MicT/MicN組的3個數據集共享的一致的小神經膠質細胞基因特征作為種子節點。將上調及下調基因作為種子注釋到網絡中。同時,對種子節點的全局影響進行4次隨機游走算法評估。經過隨機游走算法,每個候選基因分別從MicT/MacT和MicT/MicN組中得到4個分數。然后,從R包subpathwayMiner中得到子通路列表。對于每個子通路,根據隨機游走分析的基因評分計算子通路評分。經上述分析,p值<0.001的子通路被確定為小神經膠質細胞特異性子通路。如果任意兩個子通路共享超過7個基因成分,則根據這些子通路構建子通路網絡。
5. 小神經膠質細胞子通路與膠質瘤生物學的關系:對于所有膠質瘤數據集,作者考慮了三種類型的比較,包括腫瘤與正常樣本的比較、復發與原發樣本的比較、高風險與低風險樣本的比較。利用R包limma進行差異表達分析。接著進行單因素cox分析,識別高危或低危基因。沒有顯著基因結果的數據集被刪除。然后,利用超幾何檢驗方法評估子通路內基因與各數據集高風險或低風險基因的重疊情況。
6. 確定子通路預后模型:文章利用芯片表達譜作為訓練集,構建了一個預后模型。作者首先利用R包SVA中的Combat函數消除批處理效應,形成一個合并訓練集。在訓練集的基礎上,進一步計算每個子通路的NES富集分數。然后,通過最大似然估計和Lasso得到了廣義線性模型,接著確定最優參數λ,并選擇具有非零系數的子通路特征。
7. 基于HGCC資源構建藥物-子通路網絡:作者基于HGCC資源獲得了GBM細胞系的藥物IC50信息,以及基因表達、甲基化和CNV數據。首先,作者以IC50中值為閾值,定義了高IC50組和低IC50組細胞系。然后以這兩組為基礎,分別根據基因表達水平、甲基化情況和CNV數據識別藥物相關基因。 最后,利用超幾何檢驗評估差異基因與28條小神經膠質細胞子通路之間的關聯。綜合考慮這三個層次的組學數據,構建了一個完整的藥物子通路網絡。
四.研究的主要內容及結果
1. 轉錄組數據集整合分析揭示小神經膠質細胞特異性生物學作用
為了探索小神經膠質細胞在膠質瘤條件下的特定生物學作用,在文章的第一部分,作者納入了一系列已發表的RNA序列和芯片數據集,這些數據來自從膠質瘤和正常樣本分離的腦小神經膠質細胞和巨噬細胞群體。考慮到小神經膠質細胞特異性生物學特性,作者進行了兩種差異表達分析,分別為腫瘤小神經膠質細胞與腫瘤巨噬細胞的比較(MicT/MacT,包括兩個數據集)和腫瘤小神經膠質細胞與正常小神經膠質細胞的比較(MicT/MicN,包括四個數據集)。作者根據MicT/MacT和MicT/MicN的每個數據集識別差異表達基因(圖1A),接著對這些差異表達基因進行功能富集分析(圖1B)。接下來為了進一步探索這些小神經膠質細胞特異性特征基因之間的關系,作者構建了一個基于MicT/MacT和MicT/MicN共享的一致差異表達基因的子網絡。并基于已有研究的蛋白相互作用(PPI)網絡,得到了至少兩種資源共享的高質量互作關系。然后,基于PPI關系構建了一致特征基因之間的直接相互作用(圖1C)。作者將MicT/MacT或MicT/MicN內部具有相同方向的交互定義為組內交互,其他交互定義為組外交互。作者對得到的網絡分析發現許多MicT/MicN特征位于這個子網絡的中心,并與其他基因密切相互作用。而一些MicT/MacT特征則在群體交互之外。

2. 膠質瘤生物學中的9 MicT/MicN核心基因特征
在文章的第二部分,作者將4個MicT/MicN數據集中共有的9個基因定義為MicT/MicN核心基因,并進一步分析這些小神經膠質細胞特異性基因在膠質瘤形成、復發和預后等生物學問題中的參與情況。作者收集了34個來自GEO、TCGA、CGGA和PCAWG的公共數據集,分析發現如圖2A所示,這9個MicT/MicN核心基因與膠質瘤生物學密切相關。一些基因在不同的膠質瘤事件中表現出一致的表達模式。例如,OAS3和MMP19在膠質瘤樣本中表達水平高于正常樣本,在復發樣本中表達水平高于原發樣本,在高危組中表達水平高于低危組(圖2B)。研究也觀察到這些基因中,有5個基因與腫瘤純度顯著相關(圖2C和D),不過對于GBM和LGG,P2RY2在高純度和低純度組中均顯示出一致的風險預測性能。因此作者也用足夠的樣本數量測試了P2RY2特征與LGG型臨床反應的關系(圖2E),結果發現與預后表現一致,接著分析了其生物學作用,發現P2RY2的表達水平與GBM創面愈合功能有關,與LGG新抗原和非整倍體功能有關(圖2F)。

3. 識別小神經膠質細胞特異性子通路和串擾網絡
先前的一些研究已經發現,整個通路中的子通路區域與疾病的形成和進展密切相關。因此在這一部分,作者進一步開發了一種基于MicT/MacT和MicT/MicN條件識別小神經膠質細胞特異性子通路的新框架。作者首先應用了基于網絡的隨機游走算法來優化MicT/MacT和MicT/MicN組一致上調和下調特征的候選基因。其次,作者綜合考慮不同的失調影響,得到子通路列表并計算子通路評分。最后采用隨機策略評估所有子通路的顯著性。結果共識別出1/34個MicT/MacT上調/下調的子通路,18/46個MicT/MicN上調/下調的子通路。最后,作者基于四種類型的小神經膠質細胞特異性子通路,利用基因重疊構建了一個子通路串擾網絡。
4. 與膠質瘤生物學相關的小神經膠質細胞子通路
基于上述圖2A中使用的膠質瘤數據集,在這一部分作者進一步探索了小神經膠質細胞特異性子通路與膠質瘤生物學事件之間的關聯。如圖3A所示,所有這些子通路都表現出兩種表達模式。在膠質瘤的形成、復發和預后中,大多數I型子通路表現為風險表達模式,而II型子通路表現為保護表達模式。I型子通路主要來源于免疫系統和細胞群落類,II型子通路來源于細胞運動性、發育和再生類。在膠質瘤生物學上,這些子通路與腫瘤的形成密切相關,尤其是預后狀況。以通路:04810_15(來自Type II)為例,該子通路在腫瘤樣本中表現出較高的表達模式。接下來,作者用ssGSEA方法計算了該子通路的NES評分(圖3B,C),發現與之前結果的表達模式相似,該子通路在腫瘤樣本中確實表現出更高的功能活性,在復發樣本中也表現出更高的功能活性。

5. 膠質瘤預后的子通路風險特征
上面的研究結果顯示,神經網絡中的子通路與膠質瘤的預后密切相關,尤其是LGG類型。因此,在這一部分作者進一步使用Lasso基于整合的1185例膠質瘤樣本芯片數據集構建了一個預后模型。結果識別出28個預測性能最好的小神經膠質細胞特異性子通路,并將其定義為SubP28特征通路。分析發現在CGGA、TCGA和PCAWG數據庫的7個獨立測試集中,SubP28得分高的樣本比得分低的樣本表現出一致的不良生存結果(圖4A)。在腫瘤純度方面,作者觀察到LGG樣本的SubP28評分與腫瘤純度呈負相關。此外,作者在IGAP數據中量化了SubP28特征,結果發現侵襲性膠質瘤邊緣和浸潤性腫瘤區域的樣本中富集了SubP28特征的較高功能活性,而這些子通路特征在腫瘤中表現出較低的活性(見圖4B)。為了檢驗SubP28特征的小神經膠質細胞相關性,作者進一步從MsigDB數據庫中獲取了幾個小神經膠質細胞相關集,并使用超幾何檢驗計算重疊的顯著性。如圖4C所示,SubP28特征與其他小神經膠質細胞(MG)標記密切相關。此外,不同亞型的膠質瘤預后結果不同,GBM分子亞型之間的SubP28評分也存在差異(見圖4D),間充質和神經類型的樣本的SubP28評分高于其他類型。相關分析顯示,SubP28評分與巨噬細胞調節功能正相關,與CD4 T細胞負相關(見圖4E)。

6. SubP28與GBM和LGG的小神經膠質細胞狀態相關
為了進一步探討SubP28信號與小神經膠質細胞狀態之間的關系,在這一部分作者使用ssGSEA方法計算TCGA GBM和LGG樣本的小神經膠質細胞評分。利用穩態標記物和M2標記物進行相關性分析。如圖5A所示,LGG樣本的SubP28評分與小神經膠質細胞穩態狀態呈正相關,GBM樣本則不。GBM標本M1和M2小神經膠質細胞狀態下,SubP28評分與小神經膠質細胞活性呈正相關。當考慮到分子亞型和IDH1突變時,進一步觀察到M1和M2特異性關聯(圖5B)。作者也發現在未發生IDH1突變的LGG樣本中,SubP28評分與M1標記呈正相關。對于GBM分子亞型,其與M1和M2標記呈神經類型特異性正相關。此外,利用膠質瘤的兩個單細胞RNAseq數據集在多個細胞中測試SubP28特征,發現SubP28特異性與小神經膠質細胞和少突膠質細胞相關。

7. 藥物-子通路網絡揭示了新的治療策略
在文章的最后一部分作者為了預測高SubP28或低SubP28患者的藥物敏感性,系統地評估了SubP28評分與抗腫瘤藥物反應敏感性之間的關系。研究從三個資源獲得藥物反應數據,(1)GDSC數據庫,(2)HGCC隊列,(3)LENP的預測結果。利用半數最大抑制濃度(IC50)值,計算藥物或分子IC50與SubP28評分的相關性。結合相關結果和藥物治療信息,得到了兩個候選藥物集,(1)SubP28評分高的細胞系對藥物表現出較高的反應敏感性,(2)SubP28評分低的藥物表現出較高的敏感性。在藥物組1中,治療BRCA的藥物拉帕替尼在SubP28評分高的組中被識別為敏感分子。為了探究抗腫瘤化合物和28條小神經膠質細胞子通路之間的詳細關聯,作者基于HGCC資源構建了一個多組學集成網絡。如圖6所示,多個候選藥物從三個組學水平靶向了許多小神經膠質細胞特異性子通路。這些子通路中的大多數都屬于SubP28模型中的風險子通路。來自同一通路的不同子通路顯示相反的預后模式,也共享一些藥物。

到這里文章的主要內容就介紹完了,文章重點關注小神經膠質細胞,結合基因及通路兩個層面,從表達及功能角度對小神經膠質細胞與膠質瘤的關聯進行了刻畫。文章用到的方法都是常見的生信方法,小編認為亮點在于數據量豐富,整合多個平臺的數據既可以讓自己的工作內容充實,也可以增加說服力。因此,小伙伴們在進行自己課題時也可以考慮這種方式。