隨著單細(xì)胞轉(zhuǎn)錄組(scRNAseq)測(cè)序成本的降低和分析流程的優(yōu)化,scRNAseq在各類研究中的出鏡頻率越來(lái)越高。在pubmed中以“single cell RNA sequencing”為關(guān)鍵詞進(jìn)行檢索,發(fā)現(xiàn)高達(dá)2.6萬(wàn)條記錄(其中IF > 20的文章約1400篇),僅2022年就已發(fā)表1800多篇相關(guān)文章。scRNAseq普及之前,絕大多數(shù)實(shí)驗(yàn)室只能依賴TCGA bulk RNAseq進(jìn)行泛癌分析,而如今海量的scRNAseq數(shù)據(jù)為更高精度的泛癌分析提供了數(shù)據(jù)基礎(chǔ),bulk+scRNAseq泛癌分析已成為切實(shí)可行的新思路。本篇推文中,編者選取最新發(fā)表在遺傳學(xué)Top期刊《Genome Medicine》雜志上的一篇泛癌基因標(biāo)簽(gene signature)分析,對(duì)主要結(jié)果進(jìn)行解讀,并結(jié)合兩篇同類型的文章進(jìn)行總結(jié),以供讀者參考。



背景
免疫檢查點(diǎn)抑制劑(Immune checkpoint inhibitor,ICI)療法開啟了腫瘤治療的新紀(jì)元。然而,只有少量病人對(duì)治療有反應(yīng),表明仍需挖掘新的biomarkers用于病人的精準(zhǔn)分群,進(jìn)而輔助治療方案的選擇。傳統(tǒng)的biomarker研究多基于完整腫瘤組織的bulk RNAseq,很難精準(zhǔn)區(qū)分腫瘤內(nèi)部的細(xì)胞亞群,對(duì)ICI治療的指示價(jià)值有限。而scRNAseq的高分辨率特性恰好可以彌補(bǔ)這一缺陷,可更加精準(zhǔn)地表征腫瘤細(xì)胞的異質(zhì)性,從而開發(fā)表征性能更好的biomarkers。
腫瘤干細(xì)胞(Cancer stem cells,CSCs)是一類具有自我更新能力的的癌細(xì)胞,可以促進(jìn)腫瘤發(fā)生、發(fā)展和轉(zhuǎn)移。多項(xiàng)研究證實(shí)腫瘤細(xì)胞干性(stemness)與腫瘤免疫逃避及治療抵抗密切相關(guān)。一項(xiàng)基于21種實(shí)體瘤的泛癌研究發(fā)現(xiàn),腫瘤細(xì)胞干性與免疫細(xì)胞排斥相關(guān),但其與臨床ICI結(jié)果之間的負(fù)相關(guān)關(guān)系尚無(wú)直接證據(jù)。利用CytoTRACE包,作者可以預(yù)測(cè)scRNA-seq數(shù)據(jù)種每個(gè)細(xì)胞的分化狀態(tài),量化其stemness,進(jìn)而鑒定與stemness密切相關(guān)的基因。
文中,作者首先在兩個(gè)ICI scRNAseq數(shù)據(jù)中證實(shí)干性和ICI效果之間的負(fù)相關(guān)關(guān)系;隨后基于34個(gè)scRNAseq數(shù)據(jù)集(17種腫瘤類型,345個(gè)病人,66萬(wàn)個(gè)細(xì)胞)構(gòu)建干性特征標(biāo)簽(Stem.Sig),并在TCGA(>1萬(wàn)個(gè)病人,30種腫瘤類型)、CRISPR數(shù)據(jù)集(4種腫瘤類型)和10個(gè)獨(dú)立的ICI數(shù)據(jù)集種進(jìn)行了驗(yàn)證;比較發(fā)現(xiàn)Stem.Sig能比以往報(bào)道的signatures更好地預(yù)測(cè)病人對(duì)ICI治療的反應(yīng)。
結(jié)果一 腫瘤細(xì)胞干性與ICI抗性相關(guān)
基于兩個(gè)ICI scRNAseq數(shù)據(jù)集(SKCM,BCC),作者利用CytoTRACE量化了每個(gè)細(xì)胞的干性,結(jié)合治療結(jié)果發(fā)現(xiàn) non-respond(NR)患者中的腫瘤細(xì)胞干性更強(qiáng)。

結(jié)果二 基于泛癌scRNAseq數(shù)據(jù)構(gòu)建Stem.Sig
作者收集了34個(gè)scRNAseq數(shù)據(jù)集用以構(gòu)建Stem.Sig。Stem.Sig候選基因的條件為:1)在腫瘤細(xì)胞中顯著上調(diào)(logFC ≥ 0.25且FDR < 1e-5);2)與CytoTRACE scores顯著正相關(guān)(Spearman R > 0 and FDR < 1e?05);3)在34個(gè)數(shù)據(jù)集中的相關(guān)性(R)幾何平均數(shù)大于0.4。功能富集發(fā)現(xiàn)Stem.Sig中的基因顯著參與hypoxia、glycolysis、 ubiquitination、EPH-ephrin signaling、WNT Signaling及nucleotide excision repair等通路,這些通路均與腫瘤干細(xì)胞的干性維持和抗性密切相關(guān)(詳見討論部分)。且一些已報(bào)道的與ICI治療不良預(yù)后相關(guān)的基因如EPHA3、EPHA7、ENO1及ACTG1等也包含在Stem.Sig當(dāng)中。

結(jié)果三 基于TCGA泛癌轉(zhuǎn)錄組數(shù)據(jù)分析Stem.Sig與免疫抑制之間的潛在聯(lián)系
為了解析Stem.Sig與免疫特征之間的關(guān)系,作者分別從代表性基因、通路和標(biāo)簽(signature)等多個(gè)方面,探究它們與Stem.Sig之間的聯(lián)系。首先,作者鑒定了Stem.Sig與75個(gè)免疫相關(guān)基因之間在泛癌水平的負(fù)相關(guān)關(guān)系,并發(fā)現(xiàn)它與細(xì)胞毒性免疫細(xì)胞的浸潤(rùn)水平也呈負(fù)相關(guān),暗示了Stem.Sig與抗癌免疫之間的負(fù)調(diào)控關(guān)系。隨后,作者發(fā)現(xiàn)代謝通路、DNA repair和MYC signaling等與低水平免疫應(yīng)答相關(guān)的通路,在Stem.Sig高的腫瘤中顯著富集。此外,對(duì)于一些知名的免疫抑制相關(guān)特征如腫瘤內(nèi)異質(zhì)性(Intra-tumoral heterogenicity, ITH),作者發(fā)現(xiàn)其與Stem.Sig顯著正相關(guān)。而對(duì)于腫瘤突變負(fù)荷(Tumor mutation burden, TMB),它也與Stem.Sig顯著正相關(guān)。與之似乎沖突的是,高水平的TMB通常與免疫應(yīng)答相關(guān)。為此,作者將病人分為四組:high Stem.Sig/high TMB (HSHT)、high Stem.Sig/low TMB (HSLT)、low Stem.Sig / high TMB(LSHT)和low Stem.Sig / low TMB (LSLT)。通過(guò)比較不同組間免疫浸潤(rùn)水平發(fā)現(xiàn),抗癌免疫水平由高到低依次為:LSHT > LSLT > HSHT > HSLT,表明Stem.Sig水平低的腫瘤有更好的免疫水平。

結(jié)果四 利用Stem.Sig預(yù)測(cè)免疫治療效果
為了評(píng)估Stem.Sig對(duì)免疫治療的預(yù)測(cè)水平,作者收集了三類免疫治療(anti-PD(L)-1、anti-CTLA-4、anti-PD(L)-1和anti-CTLA-4聯(lián)合)共10個(gè)bulk RNAseq數(shù)據(jù),以及相應(yīng)的臨床信息。隨后,作者從7中機(jī)器學(xué)習(xí)算法中,挑選AUC值最高的Na?ve Bayes模型用于后續(xù)預(yù)測(cè)。在訓(xùn)練集、驗(yàn)證集和測(cè)試集三類數(shù)據(jù)中,均表明Stem.Sig是一個(gè)風(fēng)險(xiǎn)因子,高水平的Stem.Sig與病人不良預(yù)后顯著相關(guān)。最后,作者比較了Stem.Sig與已報(bào)道的泛癌signatures的預(yù)測(cè)水平,發(fā)現(xiàn)Stem.Sig表現(xiàn)普遍優(yōu)于已報(bào)道的泛癌signatures(更高的AUC值)。

結(jié)果五 基于CRISPR數(shù)據(jù)挖掘Stem.Sig中的潛在治療靶點(diǎn)
作者收集了7個(gè)免疫應(yīng)答相關(guān)的CRISPR數(shù)據(jù)集用于該部分分析。對(duì)數(shù)據(jù)集包含的22505個(gè)基因根據(jù)z-score進(jìn)行排序,Top-ranked的為免疫抵抗相關(guān)基因,在敲除后會(huì)促進(jìn)抗腫瘤免疫反應(yīng);Bottom-ranked的為免疫敏感基因,敲除后會(huì)抑制抗腫瘤免疫反應(yīng)。隨后,作者統(tǒng)計(jì)了Top-ranked與Stem.Sig以及其他泛癌signatures中基因的交集情況,發(fā)現(xiàn)Top-ranked基因與Stem.Sig有顯著交集,且比率顯著高于其他幾個(gè)signatures。該結(jié)果一方面挖掘了作為交集的潛在治療靶點(diǎn),另一方面再次印證Stem.Sig的預(yù)測(cè)能力要優(yōu)于其他幾個(gè)signatures。

小結(jié)
該篇文章遵循“提出假說(shuō)—建立模型—驗(yàn)證模型”的思路,框架和結(jié)果清晰簡(jiǎn)潔。作者從兩個(gè)scRNAseq數(shù)據(jù)集入手,初步建立腫瘤細(xì)胞干性和ICI治療抵抗之間的聯(lián)系,隨后基于大規(guī)模泛癌scRNAseq數(shù)據(jù)建立干性標(biāo)簽Stem.Sig,并在TCGA泛癌數(shù)據(jù)中驗(yàn)證Stem.Sig和多種免疫指標(biāo)之間的關(guān)系。為了檢測(cè)Stem.Sig對(duì)ICI治療效果的預(yù)測(cè)能力,作者從7種不同的機(jī)器學(xué)習(xí)模型中挑選最優(yōu)模型,發(fā)現(xiàn)Stem.Sig能有效預(yù)測(cè)ICI病人預(yù)后,且效果優(yōu)于已報(bào)道的一些signatures。最后,作者還整合CRISPR數(shù)據(jù),進(jìn)一步精細(xì)定位到少數(shù)可作為潛在治療靶點(diǎn)的基因。
仔細(xì)閱讀這篇文章可有以下幾點(diǎn)收獲:1)對(duì)于分析為主的老師/學(xué)生,對(duì)數(shù)據(jù)一定要有敏感性,比如文章中提到的ICI數(shù)據(jù)集、scRNAseq數(shù)據(jù)以及CRISPR數(shù)據(jù),要及時(shí)整理收藏做好記錄,不能等哪天需要了再去檢索;2)同理,文中提到了大量的signatures,比如各種泛癌signatures、免疫相關(guān)標(biāo)志物/通路,也包括Stem.Sig本身,以后但凡涉及到解析不同組間免疫差異或分子機(jī)制,都可以活學(xué)活用,從多角度提供數(shù)據(jù)來(lái)支持自己的假說(shuō);3)由scRNAseq出發(fā),結(jié)合TCGA泛癌數(shù)據(jù)進(jìn)行挖掘,一方面提高了內(nèi)容的精準(zhǔn)度,為文章增色,另一方面也是充分利用公共數(shù)據(jù),多角度證實(shí)假說(shuō)的可行途徑。
現(xiàn)在scRNAseq課題的門檻和數(shù)年之前相比已經(jīng)大幅度降低,提供了bulk RNAseq整合scRNAseq進(jìn)行分析的數(shù)據(jù)基礎(chǔ),因此對(duì)于分析為主的課題,都可以將scRNAseq數(shù)據(jù)考慮進(jìn)去,提升課題質(zhì)量。在“生信人”微信公眾號(hào)以往推文中,曾多次介紹過(guò)scRNAseq泛癌分析的相關(guān)內(nèi)容, 現(xiàn)結(jié)合其中兩篇推文的內(nèi)容,一并概括。兩篇推文中的文獻(xiàn)IF略高于6(cells,6.6;Cancers,6.1),均屬于純生信分析。
在第一篇文章(Single-Cell Transcriptomics Reveals the Expression of Agingand Senescence-Associated Genes in Distinct Cancer Cell Populations)中,作者收集了5類腫瘤的TCGA/GEO bulk RNAseq和scRNAseq數(shù)據(jù)。首先,基于TCGA/GEO數(shù)據(jù)鑒定與年齡和衰老相關(guān)的候選基因,并發(fā)現(xiàn)這些基因與在腫瘤中上調(diào)的基因之間有明顯交集。考慮到bulk RNAseq數(shù)據(jù)中非腫瘤細(xì)胞的影響,作者收集了相應(yīng)的scRNAseq數(shù)據(jù),并在腫瘤細(xì)胞亞群中利用擬時(shí)分析,揭示了年齡和衰老相關(guān)基因在不同腫瘤細(xì)胞亞型中的表達(dá)特征。文章結(jié)構(gòu)很簡(jiǎn)單,在前兩個(gè)結(jié)果中鑒定出候選基因之后,后續(xù)結(jié)果就是簡(jiǎn)單在5類腫瘤中重復(fù)多次分析,也沒(méi)有涉及更多角度的內(nèi)容。此外,由于涉及的腫瘤類型很少,因此嚴(yán)格來(lái)講并不能算是泛癌分析。

第二篇文章(Cancer-Specific Immune Prognostic Signature in Solid Tumors and Its Relation to Immune Checkpoint Therapies)中,作者首先對(duì)5個(gè)不同類型腫瘤的scRNAseq數(shù)據(jù)進(jìn)行分析,基于公開報(bào)道的免疫相關(guān)標(biāo)志物(LM22、LM7、ImSig signature和NanoString)對(duì)細(xì)胞進(jìn)行聚類分析,結(jié)果發(fā)現(xiàn)不同癌種的細(xì)胞均可分為2-3類免疫亞群,證實(shí)了腫瘤中主要免疫亞群的分群可靠性。隨后,作者基于同樣的標(biāo)志物,對(duì)TCGA 20種腫瘤進(jìn)行免疫分群,得到兩個(gè)不同的亞群,不同亞群之間有顯著的預(yù)后差異,但呈現(xiàn)出癌種特異性。為了構(gòu)建預(yù)測(cè)模型,作者分別在每一類腫瘤中利用彈性網(wǎng)絡(luò)模型進(jìn)行構(gòu)建,最終得到155個(gè)與腫瘤預(yù)后相關(guān)的基因,基于這些基因進(jìn)一步構(gòu)建的Immune Score與病人預(yù)后顯著相關(guān),但同樣呈現(xiàn)腫瘤特異性。此外,作者還結(jié)合ICI數(shù)據(jù),發(fā)現(xiàn)Immune Score可指示ICI治療后病人的應(yīng)答狀況。該篇文章中,僅有第一部分涉及到scRNAseq內(nèi)容,目的也僅僅是為了驗(yàn)證免疫分群的猜想,因此盡管涉及癌種較多,但并算不上bulk RNAseq和scRNAseq“整合分析”。

綜上,大家在設(shè)計(jì)自己課題時(shí),首先要做好數(shù)據(jù)調(diào)研,準(zhǔn)備充實(shí)的數(shù)據(jù)基礎(chǔ);其次,真正做到整合分析,而不是僅僅停留在使用了兩類數(shù)據(jù);最后的重中之重,就是結(jié)合多方位的數(shù)據(jù),講好自己的生物學(xué)故事。