大家好,今天給大家介紹一個數(shù)據(jù)庫網(wǎng)站,生物信息學文章日益增多,在線零代碼分析的腫瘤數(shù)據(jù)庫也越來越多,大部分都是連接到TCGA數(shù)據(jù)庫的癌癥數(shù)據(jù),從GEPIA到TIMER,涉及的方向也是越來越多,從基礎的表達量分析到生存分析,到近來的免疫浸潤以及日益火爆的單細胞分析,簡單直觀明了的操作界面幫助我們快捷方便的完成論文中的圖標制作,圖片質量也越來越高。
同時,惡性腫瘤是機體正常細胞癌變的產物, 具有不斷增殖并有可能在體內轉移的特點。為了生存和生長, 腫瘤細胞能夠采用不同策略抑制人體的免疫系統(tǒng), 使其不能正常地殺傷腫瘤細胞, 從而在抗腫瘤免疫應答的各階段得以幸存。簡單來說,免疫治療的目的其實就是通過調動人體強大的免疫系統(tǒng)來對抗癌癥。通過分離獲取的患者自身免疫細胞, 在細胞因子的誘導下,大量擴增出具有高度抗腫瘤活性的免疫細胞,回輸?shù)交颊唧w內以恢復患者免疫的力量進而攻擊腫瘤。漸漸的,免疫治療在癌癥治療領域不斷展現(xiàn)實力,逐漸成為癌癥治療炙手可熱的明星療法。在多個復發(fā)或難治性的惡性腫瘤中都展現(xiàn)了十分強勁的治療效果;那么今天我們來介紹一個與腫瘤免疫治療相關的在線數(shù)據(jù)庫——“TIGER”。
文章名稱:
TIGER: A Web Portal of Tumor Immunotherapy Gene Expression Resource
DOI:https://doi.org/10.1016/j.gpb.2022.08.004
雜志:Journal Pre-proofs ,if:7.614(一區(qū))

數(shù)據(jù)的來源與處理方法:
與其他很多癌癥數(shù)據(jù)庫類似,TIGER數(shù)據(jù)庫也是與TCGA數(shù)據(jù)庫鏈接的,構建數(shù)據(jù)庫的腫瘤和正常RNA-seq樣本數(shù)據(jù)來自于UCSC Xena數(shù)據(jù)庫(https://xena.ucsc.edu)。
通過搜索immunotherapy, programmed cell death protein 1 (PD-1) inhibitors, and cytotoxic, T-lymphocyte antigen 4 (CLTA4) inhibitors等關鍵詞,從GEO(https://ncbi.nlm.nih.gov/geo)和SRA (https://ncbi.nlm.nih.gov/sra)數(shù)據(jù)庫中收集具有臨床免疫治療信息的腫瘤樣本的bulk RNA-seq和基因表達芯片數(shù)據(jù)。但是在沒有原始數(shù)據(jù)的情況下,則會使用預處理數(shù)據(jù),小編認為這將不可避免地造成一些數(shù)據(jù)上的誤差,但是影響不大。
另外人類腫瘤的單細胞bulk RNA-seq是在GEO、Genome Sequence Archive (GSA) (https://bigd.big.ac.cn/gsa-human)、EMBL-EBI (https://www.ebi.ac.uk)、Single-Cell Portal數(shù)據(jù)庫中通過檢索single-cell、scRNA-seq、10x Genomics、inDrop、Smart-seq2等關鍵詞收集的。
單細胞數(shù)據(jù)的預處理方法是:
利用STAR將FASTQ格式的reads與人類參考基因組(hg38, GRCh38)進行比對,然后利用Cell Ranger導出基因表達矩陣。使用Seurat (v3.1.3) R 包對每個單細胞bulk RNA-seq數(shù)據(jù)集進行質量控制。首先,線粒體RNA含量超過10%的細胞被認為已經死亡或正在死亡,并被移除。reads數(shù)小于200或大于3000的細胞也被排除。同時表達以上三種標記物(CD2、CD79A和CD68)中一個或多個的細胞被定義為二聚體并去除。其次,將過濾后的每個樣本的基因表達矩陣用Seurat包的NormalizeData函數(shù)進行歸一化,用FindVariableFeatures函數(shù)保留高變異基因;最后,利用FindVariableFeatures和Integratedata函數(shù)對所有樣本的基因表達矩陣進行整合,并對不同樣本之間的批次效應進行校正。接下來則是常規(guī)的細胞聚類和細胞亞群注釋。
隨后,對單細胞的腫瘤樣本與正常樣本進行差異分析,通路富集分析,不同細胞類型間基因對的皮爾森相關性分析,細胞軌跡分析,細胞通訊分析。
bulk基因表達數(shù)據(jù)分析:
去除低質量的探針數(shù)據(jù),對探針進行注釋,并將數(shù)據(jù)轉換為FPKM類型。
接下來對數(shù)據(jù)進行差異分析,生存分析,相關性分析,預測免疫治療的反應。預測免疫治療反應的特征基因從文獻中獲得,每個特征基因的得分根據(jù)原研究中使用的參數(shù)計算。我們采用RRA算法以無偏差的方式整合所有特征基因的得分。整合后的得分用于預測癌癥患者的免疫治療反應。
最終以上的所有分析結果,以及TIGER中的所有數(shù)據(jù)都以MySQL表、JSON文件、Rds和RData文件的形式保存。Web接口已包括PHP、HTML、JavaScript和CSS。并使用ECharts和Rscripts生成統(tǒng)計圖。
數(shù)據(jù)庫首頁:

TIGER是一個與腫瘤免疫相關的、可基于表達數(shù)據(jù)進行多項分析的網(wǎng)站。TIGER包含來自TCGA的1508個具有免疫治療臨床結局的腫瘤樣本和11057個腫瘤/正常樣本的批量轉錄組數(shù)據(jù),以及655個樣本、2116945個細胞的單細胞轉錄組數(shù)據(jù),其中63個樣本的119039個細胞具有免疫治療臨床數(shù)據(jù)。此外,作者還收集了8個CRISPR和2個shRNA screen數(shù)據(jù),這些數(shù)據(jù)來自于抗癌免疫反應基因的研究。并從公共文獻中收集了11個可能用于預測免疫治療反應的特征基因。

TIGER由四個主要模塊組成,包括免疫治療反應模塊、反應特征模塊、單細胞免疫模塊和快速搜索免疫篩選模塊。
1.快速搜索:當用戶進入網(wǎng)站時,可以在頁面中間看到一個快速搜索欄。用戶可以通過搜索感興趣的基因Symbol,得到在所有數(shù)據(jù)集中具有顯著差異的結果,如不同細胞類型下腫瘤組織與正常組織的差異,免疫治療反應樣本與非反應樣本的差異。

2.基因信息:內含基因信息的總結,包括基因信息(Gene Information)和通路信息(Pathway Information)。

3.單細胞免疫:在單細胞免疫模塊中,用戶可以懸停在圖中圓點上或對表格排序,以發(fā)現(xiàn)不同癌癥的細胞類型標記基因。此外,用戶可以單擊表的選項卡來顯示數(shù)據(jù)集中這種細胞類型的詳細圖像。

在表達相關性分析中,用戶可以計算一個感興趣的基因與其他基因的表達之間的相關性,也可以基于輸入基因計算不同細胞類型中的表達相關性。在差異表達分析中,用戶可以點擊表格選項卡查看詳細信息,該詳細信息由UMAP圖和條形圖組成,用于可視化所選基因在不同組之間的差異表達。


4.免疫治療反應: TIGER會展示差異表達分析和生存分析。散點圖和表格將顯示每個數(shù)據(jù)集的具體差異分析結果。
5.反應特征:在AUC Matrix和Survival Matrix中,用戶可以利用基因表達數(shù)據(jù)和免疫治療臨床信息,將自己的特征基因與已知的免疫治療響應特征基因進行比較

在Correlation Matrix中,用戶可以在沒有免疫治療臨床信息的情況下,使用TCGA基因表達數(shù)據(jù)來探索感興趣的基因是否與已知的免疫治療特征基因相關。

6.免疫篩選:CRISPR screen和RNAi Screen相關的基因信息將以表格的形式顯示,點擊表格即可獲得數(shù)據(jù)集相關信息。

小結:
TIGER 可以對與癌癥免疫治療相關的基因或單細胞轉錄組的基因表達數(shù)據(jù)進行綜合分析。與 TCIA、TIDE 和 TISCH 等其他現(xiàn)有工具相比,TIGER 具有多個優(yōu)勢:
1. TIGER 是第一個整合了癌癥bulk RNA-seq、芯片數(shù)據(jù)和單細胞基因表達數(shù)據(jù),并用以發(fā)現(xiàn)癌癥免疫治療中的抗腫瘤免疫機制并反應生物標志物的在線數(shù)據(jù)庫。
2. TIGER 擁有最全面的癌癥免疫治療相關轉錄組基因表達數(shù)據(jù),包含了33 種癌癥類型的 11,057 個腫瘤和正常樣本的非免疫療法基因表達數(shù)據(jù)、8 種癌癥類型的 1508 個腫瘤樣本的免疫療法基因表達數(shù)據(jù),以及來自 25 種癌癥類型的 655 個樣本的 2,116,945 個細胞的單細胞基因表達數(shù)據(jù)。
3. 與其他工具相比,TIGER 包含更多用于bulk RNA-seq和單細胞基因表達數(shù)據(jù)的分析和可視化功能。特別是,使用 scbulk RNA-seq在腫瘤和正常細胞之間以及不同細胞類型之間進行差異分析,使用戶能夠探索抗腫瘤免疫并開發(fā)特定細胞類型的基因特征。