大家好~ 小編今天和大家分享的是最新發表在AGING雜志上的一篇文章,作者基于細胞周期相關基因來構建胃癌患者預后模型,為胃癌患者的診療及預后效果評估提供了新參考,雖然簡單,但借鑒意義很強,難道你們不想學嗎?ok 進入主題~

哺乳動物的細胞周期具高度的組織結構性,其精準調控對于遺傳物質的復制和細胞分化具重要作用。細胞周期的調控機制包括生長調節和遺傳完整性。癌癥表現為細胞周期活性的異常,這可能是由于下游信號通路中的基因突變或編碼細胞周期蛋白的基因發生變異而導致的。一些細胞周期調控因子的變異能夠導致胃癌(gastric cancer, GC)的發生。研究發現,細胞周期調控因子能夠作為胃癌患者的預后標志物,具重要的臨床價值。
胃癌是全球最常見的5種癌癥類型之一,具較高的發病率和死亡率。盡管采取手術和輔助療法等,但患者的預后效果仍并不理想,5年存活率低于25%。目前,預后預測主要依賴于組織病理學診斷和腫瘤分期。然而,很多患者盡管臨床病理特征相似,但預后情況卻存在很大差異。
雖然已經花費了大量的努力來開發用于胃癌患者預后預測的最佳工具,但目前還未達成共識。在目前已發表的大部分文章中,通常使用臨床基本特征(例如:腫瘤大小、淋巴結數目和淋巴血管侵犯等)和單分子生物標志物(例如:CD44、PPAR γ、IL-13Rα2、HDAC6)來構建預后模型。但僅僅使用單基因生物標志物來進行患者預后預測是遠遠不夠的。隨著測序技術的不斷發展,預后相關的多標志物整合對于胃癌患者的預后預測具重要的潛在應用價值。
本研究中,基于TCGA-STAD數據集,作者首先鑒定在癌和癌旁正常組織之間差異表達的細胞周期相關基因。然后,使用單因素cox和LASSO分析進一步篩選和胃癌患者預后顯著相關的基因,并基于這些基因構建預后模型。同時,從GEO數據庫下載GSE84437數據集作為驗證集,對模型進行驗證。
1 材料與方法
1.1 基因表達譜數據的獲取
從TCGA數據庫下載胃癌患者基因表達譜數據TCGA-STAD,共獲得癌癥樣本375例,正常組織樣本32例。細胞周期相關基因列表從KEGG數據庫獲取,共獲得125個細胞周期相關基因。從GEO數據庫下載GSE84437數據集作為驗證集,用于預后模型的驗證。
1.2 差異表達的細胞周期相關基因的鑒定
差異分析使用R package limma。以FDR < 0.05且logFC > 0.5作為差異基因的篩選標準。
1.3 預后模型的構建
使用單因素cox分析篩選與胃癌患者預后顯著相關的差異表達的細胞周期相關基因。使用Wald檢驗計算每個基因的HR值和p-value,以p-value < 0.05作為篩選條件。使用R package glmnet進行LASSO回歸分析,進一步篩選與患者預后相關更顯著的基因?;贚ASSO分析篩選出的基因,進行多因素cox回歸分析構建預后模型,獲得風險評分計算公式。將基因表達量帶入公式,對患者進行打分,根據評分的中位數,將患者分為高、低風險組。接下來,作者通過KM曲線和ROC曲線進一步評估模型的準確性,并在驗證集中進行驗證。
1.4 列線圖模型的構建
列線圖模型的構建使用R package rms,納入的因素包括:患者的生存信息、年齡、T分期、N分期和風險評分。使用C-index和AUC值來評估模型的敏感性和特異性。
1.5 基于免疫組化的基因表達水平評估
該部分研究,作者共獲取250個腫瘤組織樣本和144個正常組織樣本,均來自我國胃癌患者(N = 250)。基于TCGA數據集的分析結果,發現CDC6和MCM3基因的表達水平與胃癌患者的預后顯著相關。因此,作者選擇這兩個基因進行免疫組化實驗來進一步驗證基因的表達水平。
1.6 GSEA富集分析
基于TCGA-STAD隊列中高、低風險組間的差異表達基因,使用GSEA算法鑒定差異基因的富集通路,以p < 0.05且FDR < 0.25作為篩選條件。
1.7 統計學分析
全部的統計學分析均在R v4.0.4中進行。使用χ2檢驗評估風險評分與臨床特征之間的相關性。使用KM曲線和log-rank檢驗來評估高、低風險組間患者的生存差異。單因素和多因素cox用于計算風險評分和患者生存狀態的相關性。AUC值用于評估模型預測的準確性。
2 結果
2.1 基于細胞周期相關基因的預后模型的構建及驗證
基于TCGA數據庫334個胃癌患者(OS > 30d)、55個細胞周期基因的表達矩陣構建預后模型。單因素cox回歸分析初步篩選出7個與胃癌患者預后顯著相關的基因,分別為:GADD45B、TFDP1、CDC6、CDC25A、CDC7和SMC1A。LASSO回歸分析結果沒有進一步篩選掉基因,因此這7個基因被納入到預后模型的構建。多因素cox分析得出風險評分公式為:0.0090 × GADD45B表達量 - 0.0116 × TFDP1表達量 + 0.0053 × CDC6表達量 - 0.0177 × CDC25A表達量 - 0.0127 × CDC7表達量 - 0.0157 × SMC1A表達量 - 0.0018 × MCM3表達量?;谏鲜鲲L險評分公式,給每一個患者進行打分,將患者分為高、低風險組。
預后模型的驗證使用GEO數據集GSE84437,同樣僅納入OS > 30d的患者,共431例。根據訓練集得出的風險評分公式,將患者劃分為高、低風險組。接下來,作者基于KM算法繪制高、低風險組患者的生存曲線。從圖1中可以看出,訓練集和驗證集中高、低風險組間患者的生存均存在顯著差異。

2.2 預后模型和臨床指標的預后風險值
納入的臨床指標包括:年齡、性別、T分期和N分期,TCGA和GEO隊列均為上述4個指標,評估患者臨床病理特征與其預后情況的相關性。通過單因素和多因素cox分析結果,作者發現患者年齡、T分期和N分期與其預后情況顯著相關。此外,分析結果表明,所構建的預后模型(風險評分計算公式)可作為生存狀態的獨立預后因素。
接下來,作者通過ROC曲線評估模型的特異性和敏感性(圖2)。訓練集和驗證集ROC曲線下面積-AUC值分別為:0.656和0.629,說明模型具中等水平的特異性和敏感度。

2.3 列線圖模型的構建及驗證
作者納入年齡、T分期、N分期和風險評分共4個因素來構建列線圖模型。從圖3中可以看出,該模型對胃癌患者1年生存率的預測具較好的效果。臨床模型(包括年齡、T分期、N分期)、預后模型和列線圖模型的一致性指數(consistency indices,C-indices)分別為0.636、0.622和0.677。臨床模型的C-index顯著低于列線圖模型(p < 0.001)。將臨床模型和預后模型進行合并,1-、2-、3-年生存率的AUC值分別為:0.708、0.727和0.657。因此,作者認為,列線圖模型對于胃癌患者生存預后預測能力要優于臨床模型。

2.4 蛋白水平的免疫組化驗證
通過免疫組化實驗獲得234名中國胃癌患者的CDC6和MCM3基因的表達水平。作者發現,這兩個基因在腫瘤組織中的表達水平顯著高于正常組織(p < 0.01)。在全部的患者中,其中有232名患者的生存時間大于30天,我們僅將這些患者的生存數據納入到單因素和多因素cox分析中。分析結果表明,TNM分期與胃癌患者的預后顯著相關(表1)。此外,CDC6基因可作為T1-3N1-2M0分期患者的獨立預后因素,且在ACJJ的第7版本中沒有出現腫瘤血管血栓(圖4)。


2.5 GSEA富集分析
基于TCGA-STAD隊列差異基因的GSEA富集分析結果表明,細胞周期通路顯著富集在低風險組(p < 0.001且FDR < 0.001)。

3 全文結論
作者基于TCGA和GEO數據集構建了7個細胞周期相關基因的預后模型。該模型能夠促進胃癌患者的個體化診斷和治療,并進一步地提高患者的預后。