近幾年,以NGS腫瘤基因組、轉錄組數據為基礎的研究層出不窮,可謂是呈爆發式地增長。那我們如何根據腫瘤基因組數據發文章?不同檔次的文章通常又是什么樣的內容和訣竅?需要明確一點,我們常規的文章都是融合了基因組和轉錄組以及臨床信息。單純基因組的研究,除了突變過程、腫瘤基因組進化、基因融合以及染色體不穩定性等難度系數較大的機制方面的解析型研究之外,其他的比較罕見。因為很難講述一個完整的故事,加上基因組數據的稀疏性,并不好做文章。因此,在涉及到腫瘤基因組數據的研究中,我們根據近幾年發文總結,大致將文章檔次分為3類:
7分以上的文章:“熱點+創新點是核心+工作質量”
5-7分的文章:“創新點較明確,工作質量很重要”
5分以下的文章:“工作質量和結果更重要”
下面我們主要針對bulk測序的研究,以一些典型的案例分析一下:
一、7分以上:“熱點+創新點是核心+工作質量”
當前bulk水平的研究熱點毋庸置疑包括:腫瘤異質性(如患者的分子分型、腫瘤進化)、腫瘤微環境(包括免疫微環境、細胞狀態刻畫)、診斷、預后(如生物標志物識別、預后模型構建)、治療(如免疫治療、化療和靶向治療)。當然還有單細胞水平的細胞狀態解析、空間轉錄組等。在保證熱點研究的基礎上,如果文章有明確的創新點,故事邏輯性較強,工作質量還不錯的話,那上7分的雜志是很輕松的。下面舉幾個例子詳細剖析。
【案例一】慢性淋巴白血病亞克隆結構對臨床預后的影響及突變復雜性研究
Ref: Clinical impact of the subclonal architecture and mutational complexity in chronic lymphocytic leukemia. Leukemia. 2018.
這篇文章屬于非常經典的克隆結構分析的文章,算是該領域里程碑式的研究,思路很簡單。本文最大的亮點在于首次發現了突變的克隆性能在原本不影響生存的突變狀態識別出來與生存相關的clonal突變或者subclonal突變,或者原本與生存相關的突變狀態中加入克隆性之后進一步將患者生存分開,識別出更惡性的clonal突變或者subclonal突變,打破了傳統的只基于突變狀態刻畫患者預后的研究模式。
首先,作者在慢性淋巴白血病中,基于腫瘤細胞比例(CCF:針對某個突變,癌細胞中攜帶該突變的細胞數目與所有腫瘤細胞的比值。CCF越大,表明該突變更可能被所有腫瘤細胞攜帶,因此更傾向屬于突變的早期事件,定義為clonal突變;而CCF越小,表明該突變更可能被一小部分腫瘤細胞攜帶,因此更傾向屬于突變的晚期事件,定義為subclonal突變),推斷了driver突變基因的克隆性,判斷這些突變在樣本中哪些表現是clonal的,哪些是subclonal的(圖1)。表明,在慢性淋巴白血病中,subclonal突變比clonal突變更常見。

接下來,作者評估了driver基因在慢性淋巴白血病中的突變保守性。首先,作者發現大部分的driver基因都是攜帶一個突變,除了一小部分driver基因在樣本中有多個突變(圖2A)。然后舉了幾個特定的例子說明樣本中driver基因的不同突變在樣本中CCF值的比較(圖2B),以及通過縱向取樣(兩個不同的時間點)比較,發現一些突變是逐漸獲取的,一些突變是不隨時間變化的(圖2C)。

接下來,作者根據所有driver基因突變的克隆性以及拷貝數變異的克隆性將樣本分為不同的類型,確定其進化分型。并據此推斷driver突變和拷貝數變異的時序性(該時序性判斷的原理就是通過CCF大小比較在樣本中的數量。比如說在100個樣本中,有90個樣本TP53突變的CCF值比PTEN突變的CCF值大,那我們大概率可以認為TP53突變在PTEN突變的前面發生)(圖3)。

最后,作者基于突變的克隆結構預測患者的進展和結局,即跟患者生存關聯。作者刻畫了突變克隆結構與患者首次治療時間(Time to first treatment, TTFT)的關系。例如,RPS15的clonal突變具有更短的首次治療時間,而低CCF的subclonal突變具有更長的首次治療時間,類似的結果在ATM基因中也得以呈現(圖4左)。此外,作者觀察到原本突變狀態與患者OS不相關的基因(如FBXW7和NOTCH1),將其克隆結構引入之后,發現FBXW7和NOTCH1的clonal突變相比于野生型的樣本均表現出更差的預后,而subclonal突變卻未表現出類似的現象(圖4右)。

【案例二】三陰性乳腺癌患者對蒽環類/紫杉烷類藥物的應答研究
Ref: Combined homologous recombination repair deficiency and immune activation analysis for predicting intensified responses of anthracycline, cyclophosphamide and taxane chemotherapy in triple-negative breast cancer. BMC Med. 2021.
這是一篇很好的基因組、轉錄組以及臨床特征應用相結合的文章。因為三陰性乳腺癌目前為止還沒有實用的靶向治療策略,只有一部分的患者在經歷過蒽環類/紫杉烷類藥物的標準治療后,獲得病理上的完全應答,并具有較好的生存,而大部分患者因復發進展而死亡。在這一背景下,作者很好地抓住了這一亟待解決的治療困難。根據三陰性乳腺癌的異質性,識別哪些患者接受藥物治療后應答,哪些會出現進展,就很有臨床意義。
作者首先刻畫了三陰性乳腺癌患者中的基因組突變事件,并將其與所有乳腺癌患者進行對比,發現三陰性乳腺癌患者顯著富集了基因組突變事件,包括同源重組修復缺陷(HRD)。并且借助多種基因組特征(包括突變過程SBS3活性、同源重組相關基因突變、以及BRCA1表觀沉默)刻畫同源重組修復缺陷(HR-D)與同源重組修復非缺陷(HR-P)患者之間的差異性(圖5)。

接下來,作者借助于腫瘤基因組數據,巧妙利用同源重組修復缺陷狀態刻畫了三陰性乳腺癌對蒽環類/紫杉烷類藥物的應答異質性。作者通過分析發現同源重組修復缺陷(HR-deficiency)的三陰性乳腺癌患者更傾向表現出對該類藥物的化療應答(圖6)。

此外,作者借助HRD狀態和對蒽環類/紫杉烷類藥物的應答狀態刻畫了三陰性乳腺癌患者的免疫微環境異質性,并通過多種免疫反應機制表明一些患者可能適合免疫阻斷治療(圖7)。

最后,作者結合HRD活性和免疫反應活性水平,發現二者聯合能夠顯著提升對蒽環類/紫杉烷類藥物應答者的識別效能(圖8),進而進一步識別出了對該類藥物應答的三陰性乳腺癌患者,這對三陰性乳腺癌患者在臨床治療上是非常有價值的。這篇文章很好地結合了基因組數據與臨床特征,并在藥物應答方面具有良好的預測效能,具有實用性。

【案例三】DNA損傷修復缺陷在泛癌中的基因組和分子景觀描繪
Ref: Genomic and Molecular Landscape of DNA Damage Repair Deficiency across The Cancer Genome Atlas. Cell Rep. 2018.
這篇文章無疑是基因組研究中的一篇經典文章,涉及到樣本量大、癌型廣、實用性強等特征。創新點在于首次在大群體、多癌型中刻畫DNA損傷修復基因的變異,具有很強的實用價值。在這篇文章中,作者使用TCGA泛癌基因組數據,通過整合基因組于分子分析,在33種癌癥類型中全局性地識別了DNA損傷修復的變異頻率。并在全基因組范圍內計算了與基因組不穩定性及其失衡相關的基因與通路,并證明了DNA損傷修復缺陷對于臨床預后的價值(圖9)。

作者通過計算DNA損傷修復相關通路內基因在各種癌癥類型的樣本中的變異頻率,分析發現DNA損傷修復相關基因的基因組變異在大多數癌癥類型中是廣泛存在的,并且同源重組修復相關基因的變異是最頻繁發生的(圖10)。此外,作者發現DNA損傷修復功能丟失與癌癥基因組變異頻率及類型是相關的(圖10)。

最后,作者計算了用于刻畫染色體不穩定性的同源重組修復缺陷得分(HRD score),并探索了其臨床應用價值。結合臨床信息,作者發現HRD score在不同癌癥類型中與患者更好或者更差的生存狀態是相關的。例如,在膠質母細胞瘤(GBM)中,HRD score作為一個保護性因素,越高的HRD score,患者生存越好;相反,在前列腺癌(PRAD)中,HRD score作為一個風險因素,越高的HRD score,患者生存越差(圖11)。本片研究作者這樣設計的HRD score深受研究者的歡迎,成為同源重組修復缺陷研究范圍不得不考慮的指標。

5-7分:“創新點較明確,工作質量很重要”
通過解析5-7分的文章,我們不難發現這類文章要求具有較為明確的創新點,并且工作質量較高,加之文章必要的邏輯性以及必要的證據支持,發到這個檔次也很輕松。下面介紹兩篇代表性的文章。
【案例一】基因組突變過程在泛癌中的致癌效益及臨床應用分析
Ref: Analysis of Mutations and Dysregulated Pathways Unravels Carcinogenic Effect and Clinical Actionability of Mutational Processes. Front Cell Dev Biol. 2021.
這是一篇純腫瘤基因組的文章。在這篇文章中,作者的作圖功底是相當了得,我們從文章的組圖中可以看到,所繪制的圖形幾乎是CNS級別的。所以說做的質量還是蠻不錯的,值得借鑒。遺憾的是在寫作并不出彩,文章發在這個檔次有點虧了。刨除這些因素之外,本篇文章最大的亮點在于全方位揭示了突變過程的對基因組突變的致癌風險以及對生物學通路的誘變。打破了傳統意義上的功能富集分析和簡單的功能描述。此外,本篇文章邏輯想很強,并且敘事觀點明確。
首先,作者在34種癌癥類型/亞型中刻畫了不同突變過程的致突變能力,從全局角度說明了基因組變異的異質性(圖12AB)。例如對于某種突變過程在不同癌癥類型中致癌風險的異質性(圖12C),以及不同突變過程在同種癌型中致癌風險的異質性(圖12D)。

接下來,作者在泛癌水平刻畫了突變過程對高頻突變基因的塑造景觀。發現突變過程SBS1(衰老相關的突變過程)主要在LGG_IDHmut亞型的腫瘤中誘導IDH1基因R132H位點的突變,而突變過程SBS4(煙草暴露相關的突變過程)主要在肺腺癌中誘導KRAS基因G12C位點的突變(圖13)。

接下來,作者全局性刻畫了突變過程對生物學通路的影響,揭示了突變過程在通路擾亂作用中的異質性。例如細胞外基質通路、小分子轉導以及蛋白代謝等通路,由絕大部分的突變過程共同參與完成擾亂。而DNA雙鏈修復通路、感染性疾病、以及細胞周期相關的通路主要由某幾種特定的突變過程(包括SBS2/13,SBS10)所主導擾亂(圖14)。尤其是突變過程SBS2/13(APOBEC特性相關的突變過程)特異性誘導DNA雙鏈修復(主要的通路是同源重組修復)通路紊亂,這為接下來作者聯合同源重組修復缺陷和APOBEC的研究做了很好的鋪墊。

確實,作者通過多種證據證明了同源重組修復缺陷和APOBEC的相關性與互補性(圖15A-E),并將其應用于臨床上表明了二者的預后價值(圖15F-H)。作者借用列線圖表明同源重組修復缺陷和APOBEC能夠提升患者的預后效能,使用K-M曲線表明二者的聯合能夠進一步識別與膀胱癌對鉑類藥物治療應答更長生存時間相關的患者(圖15)。最后,作者借助多因素Cox回歸分析表明APOBEC作為顯著獨立的預后因子與更長的生存時間相關。這一步驟升華了主題,將上一步的研究發現直接應用與臨床,表明研究的意義和價值。

【案例二】與三陰性乳腺癌抗癌藥物適應性相關的研究
Ref: Applicability of Anticancer Drugs for the Triple-Negative Breast Cancer Based on Homologous Recombination Repair Deficiency. Front Cell Dev Biol. 2022.
這篇文章作為利用基因組特征進行藥物重置的文章,也算是藥物基因組分析中比較全面的研究了。這篇文章其實沒有什么特別新奇的地方,主要還是借用常規的分析,解決臨床/實驗問題,比較有意義。在這篇文章中,作者借助同源重組修復缺陷狀態(HRD),刻畫了三陰性乳腺癌患者的藥物敏感性,揭示了同源重組修復缺陷(HR-deficiency)和非缺陷(HR-proficiency)的患者分別適合哪些藥物治療。作者發現有些已知的在HR-deficiency患者中應答的藥物盧卡帕尼(Rucaparib)和阿霉素(Doxorubicin)表現出更強的敏感性。而紫杉醇在HR-deficiency的患者表現出更強的耐藥性(圖16)。對于所識別到的藥物,作者將通過其他方式進行驗證分析。

接下來,作者基于MSigDB數據庫中的藥物基因組signature,進行驗證分析。并通過藥物治療對hallmark生物通路擾動解析藥物作用機制,作者發現阿霉素的反應激活了G2M檢查點和DNA修復通路,而順鉑的耐藥性與血管生成(Angiogenesis)以及上皮-間質轉化(EMT)的激活相關(圖17)。

為了通過其他方法進行進一步說明,作者首先在轉錄組層面識別了同源重組修復缺陷signature,并利用CMap分析,揭示了藥物小分子對HRD signature轉錄水平的擾動模式。例如發現Doxorubicin在MCF7細胞系中表現為,促進HRD signature上調基因的表達,抑制HRD signature下調基因的表達。而Palbociclib在SKBR3細胞系中表現為,抑制HRD signature上調基因的表達,促進HRD signature下調基因的表達(圖18)。作者通過藥物擾動模式將藥物進行分類,發現不同Cluster中的藥物,其敏感性水平更傾向呈現負向相關性,表明藥物treatment機制的共性與特異性(圖18)。

最后,作者將阿霉素的藥物敏感性在多套接受阿霉素治療的三陰性乳腺癌患者中進行臨床驗證分析,均發現對阿霉素敏感/完全應答的患者具有更小的IC50值(圖19)。并且,校正其他臨床因素之后,發現研究中阿霉素的IC50值作為顯著的風險因素與患者更差的生存及更短的阿霉素應答時間相關(圖20)。


5分以下:“工作質量和結果更重要”
【案例一】多區域NGS刻畫非小細胞肺癌腫瘤基因組進化的研究
Ref: Revealing the subtyping of non-small cell lung cancer based on genomic evolutionary patterns by multi-region sequencing. Cancer Med. 2020.
這篇文章最大的亮點就是借助進化樹刻畫了基因組瘤內異質性,并很好地將其與臨床特征掛鉤:異質性高的患者具有更差的預后和更高級的腫瘤特征。在這篇文章中,作者借助腫瘤組織多區域測序數據的基因組突變數據,在刻畫不同非小細胞肺癌亞型基因組突變異質性的同時,構建了患者層面的腫瘤基因組進化樹(圖21)。發現大部分的driver突變更傾向于在樹干中,即被所有組織所攜帶。

接下來,作者巧妙的使用數字量化進化樹的樣式,并利用進化樹的分枝模式進行聚類分析,將患者分為3類:第一類樣本進化樹枝繁葉茂,表現為更高的亞克隆多樣性(分枝多樣性);第二類樣本樹干筆直,枝葉短小,表現為最低的瘤內異質性;最后一類樣本樹干樹枝對等,表現為瘤內異質性和亞克隆多樣性適中的特點(圖22)。

接下來,作者將進化樹亞型與臨床特征(包括生存時間、腫瘤size、TNM分期)結合分析,發現作為異質性最高的subtype 1表現出更差的生存時間、更大的腫瘤size以及更高級別的TNM分期。成功地將基因組特征應用于臨床特征中,揭示了非小細胞肺癌瘤內異質性對患者的臨床結局的影響(圖23)。

最后,作者借助進化樹基因組突變的分布以及Bradley-Terry模型,識別了亞型特異性早期driver突變特征基因,通過互斥/共發生刻畫其亞型中的變異狀態,借助功能解析這些特征基因的異質性(圖24)。

【案例二】與腫瘤三級淋巴組織結構相關的基因組特性和臨床結果的泛癌分析
Ref: Pan-cancer analysis of genomic properties and clinical outcome associated with tumor tertiary lymphoid structure. Sci Rep. 2020.
這篇文章思路非常簡單,工作量也不大,用的數據和指標都是別人的,作者只是在泛癌中進行了結果闡述,并有持續的陽性結果輸出,也算是套路性的,發到這個檔次的雜志不足為奇。在這篇文章中,作者首先基于前人研究的12個趨化因子的signature量化了一個指標,叫做三級淋巴結構(TLS, tertiary lymphoid structure)。作者觀察了該指標在泛癌中的分布,以及在腫瘤組織和癌旁組織中的差異性(圖25)。

接下來,作者在不同癌型中刻畫了TLS與總的突變數目及新抗原負荷的相關性。并借助已知driver基因的突變狀態,刻畫患者的TLS與driver突變的相關性(圖26)。

接下來,作者在泛癌中,根據TLS值將患者平均分為三組,去掉中間組,選取低得分組和高得分組,刻畫其對患者生存時間的影響(圖27)。

最后,作者在非小細胞肺癌和皮膚癌中刻畫了TLS對免疫治療后患者生存的預測效能,發現高TLS的患者與免疫治療應答相關,相對于低TLS,高TLS與免疫治療后更長的生存時間相關(圖28)。

【案例三】借助多組學數據識別胃癌預后marker的研究
Ref: Identification of novel prognostic biomarkers by integrating multi-omics data in gastric cancer. BMC Cancer. 2021
這篇研究屬于常規的biomarker篩選的文章,但借助多組學數據。工作量并不大,但內容挺飽滿。在這篇文章中,作者借助多組學測序數據識別了分子marker基因。首先,通過基因組突變和拷貝數變異對表達水平的影響,識別了候選mRNA, miRNA以及轉錄因子。之后通過拷貝數變異對患者生存時間的影響,識別了預后相關的關鍵基因(KD genes)(圖29)。

作者刻畫了這些KD genes的拷貝數變異和突變狀況,以及miRNA, 轉錄因子所參與的轉錄調控網絡(圖30)。

刻畫了這些關鍵基因的功能特征以及與癌癥hallmark的語義相似性,表明這些基因的致癌特性(圖31)。

作者基于這些KD genes的表達水平與藥物敏感性IC50的相關性,篩選抗癌藥物,特別發現,一種治療結直腸癌的抗癌藥物伊立替康在KD gene DERL1低表達的患者中表現出更強的敏感性,而紫杉醇在KD gene HMGB2低表達的患者中表現出更強的耐藥性(圖32)。

接下來,作者基于這些KD genes的表達水平進行層次聚類分析,探索不同亞型間的臨床特征以及預后價值(圖33)。比較常規的分析。

結語:
發文章的檔次從來都不是由工作量決定的,而是觀點的創新性、敘事完整性以及圖文工作質量。好點的雜志文章要求創新性的同時,故事邏輯性強、支持觀點的證據充分,搭配不錯的工作質量,發在7分以上的雜志很輕松。故事的飽滿程度只能為整個研究錦上添花,而非決定性因素。如果創新性稍遜,但敘事的完整性、故事邏輯性和質量姣好也能夠撐起5分左右的雜志。拋開創新性不談,如果當前課題不是冷門領域,故事邏輯性、研究結果所提供的證據可以將發文穩定在3-4分左右的雜志。如果是3分以下的文章,我們只需要保證工作質量和穩定的結果輸出,是完全不成問題的(PS:我們設計的課題,任何一個方案,即便是小項目,只要有主干是陽性結果,發在3分以下的雜志很easy,因此這里沒有進一步詳細講解)。當然,我們任何文章都不可能只占上述其中的某些點,多少都會多數涉及,只是占比的大小問題。