肝癌是全世界第六大常見癌癥,對肝細胞癌(HCC)細胞系建立全面的蛋白質(zhì)組學分析及譜庫以應用于數(shù)據(jù)非依賴性采集(data independent acquisition, DIA)量化對于研究肝癌的發(fā)生發(fā)展及潛在治療靶點的研發(fā)具有重要意義。本文介紹了9種常用的HCC細胞系的蛋白質(zhì)組,其中涵蓋9208個蛋白質(zhì)組,HCC譜庫包含253,921個前體,168,811個肽和10,098個蛋白質(zhì)組。蛋白質(zhì)組學概述揭示了不同細胞系之間的異質(zhì)性,以及腫瘤組織在增殖轉(zhuǎn)移特征和藥物靶點表達方面的相似性。HCC譜庫支持對HepG2的7,637個三組蛋白組進行2小時DIA分析,以揭示其生物學變化??傊?,本研究為利用LC-Orbitrap平臺對HCC細胞株和DIA進行高效定量提供了重要資源,有助于進一步探索HCC的分子機制和候選治療靶點。
論文ID
實驗設計
實驗結(jié)果
肝癌是全世界第六大常見癌癥,其中肝細胞癌(Hepatocellular carcinoma, HCC)約占所有原發(fā)性肝癌的90%。對HCC蛋白質(zhì)組學的研究擴展了目前對其分子基礎的認知?;?/span>BCLC 0-A期肝細胞癌患者的無標記蛋白質(zhì)組學數(shù)據(jù),我們定義了三個亞型,并發(fā)現(xiàn)SOAT1是一個潛在的治療靶點。Gao等人通過基于等壓串聯(lián)質(zhì)譜標簽(Tandem mass tag, TMT)的蛋白質(zhì)組學方法確定了HCC患者的腫瘤特征,并確定了兩種預后生物標志物——PYCR2和ADH1A4。癌細胞系是腫瘤生物學和治療方法開發(fā)中應用最廣泛的模型系統(tǒng),因此,在蛋白質(zhì)組水平上的清晰認識有助于我們更好地利用肝癌細胞系分析分子機制和篩選抗腫瘤藥物。2014年,Megger, D.等人對HepG2、Hep3B和SK-Hep-1混合蛋白組進行了無標記分析,鑒定出2757個蛋白組和13744個肽。2020年,基于TMT的蛋白質(zhì)組學分析了《Cancer cell Line Encyclopedia》中375個細胞系的蛋白質(zhì)組,但未覆蓋HepG2.2.15、PLC/PRF/5、MHCC97L、MHCC97H、HCCLM3和HCCLM67等常用HCC細胞系。最近,Goncalves, E.等人通過數(shù)據(jù)非依賴性采集(data independent acquisition, DIA)方法從949個細胞系中鑒定出8497個蛋白組,從Huh7中鑒定出5302個蛋白組,從Hep3B中鑒定出5589個蛋白組。然而,HCC細胞系在蛋白質(zhì)組水平上是相同的還是異質(zhì)的尚不明確。同時,HCC細胞系是否在蛋白質(zhì)組水平上代表原發(fā)性肝癌腫瘤仍不清楚。因此,對HCC細胞系的蛋白質(zhì)組學特征及其與原發(fā)性肝癌腫瘤的比較仍有必要進行系統(tǒng)的探索。
整體實驗設計如表1、圖1所示。培養(yǎng)9株HCC細胞株,提取總蛋白裂解物,胰酶消化成多肽。采用高pH反相肽分離法(Hp-RP)將每個細胞系的多肽預分至6個組分,采用DDA模式進行液相色譜-串聯(lián)質(zhì)譜(LC-MS/MS)分析(表1)。獲得的原始文件通過MaxQuant 2.0.3.0版本進行數(shù)據(jù)庫檢索。然后進行基因本體(Gene Ontology, GO)和單樣本基因富集分析(single sample gene set enrichment analysis, ssGSEA)。HCC譜庫的生成:分別采用Hp-RP對HCC細胞系或腫瘤組織的肽進行混合和分離,然后采用LC-MS/MS進行分析(表1)。獲得的文件通過MaxQuant2.0.3.0版本進行數(shù)據(jù)庫檢索,并將檢索結(jié)果導入到SpectronautTM (15.2版本, Biognosys AG, Switzerland)(圖1),生成譜庫,該譜庫可用于SpectronautTM版本15.2和DIA- NN 1.8版本進行DIA定量。
1. 肝癌細胞系的蛋白質(zhì)組學分析
從9個HCC細胞系的162個肽片段中,累計鑒定出9208個蛋白組(圖2a),其中61.5%均在9個HCC細胞系中檢測到(圖2b)。這些蛋白質(zhì)組對應于160,042個肽,97%的蛋白質(zhì)組至少有兩個獨特的肽(圖2c)。每個細胞系重復3次具有較高的定量重復性(每個細胞系重復3次之間的Pearson相關系數(shù)大于等于0.95,圖2d)。所有HCC細胞株與其他細胞株具有相似性(Pearson相關系數(shù)大于等于0.8), MHCC97L、MHCC97H、HCCLM3、HCCLM6細胞株之間具有較高的一致性, HepG2細胞株與HepG2.2.15細胞株之間具有較高的一致性(Pearson相關系數(shù)大于等于0.9)。與Goncalves, E.等和Nusinow, D.P.等報道的數(shù)據(jù)相比,我們的蛋白質(zhì)組學數(shù)據(jù)還識別出HepG2、Hep3B和Huh7中的1800、896和911個蛋白質(zhì)組(圖2e)。
在細胞系和人體組織中,蛋白質(zhì)組和轉(zhuǎn)錄組之間的相關性很低。比較5種HCC細胞系(Hep3B、HepG2、Huh7、MHCC97H和GSE9709829中的PLC/PRF/5)的轉(zhuǎn)錄組和蛋白質(zhì)組,我們也發(fā)現(xiàn)蛋白質(zhì)組和轉(zhuǎn)錄組之間的一致性較差:Pearson相關系數(shù)平均值為0.34;37.2%的蛋白質(zhì)組與其轉(zhuǎn)錄組表現(xiàn)出高度一致性(Pearson相關系數(shù)大于0.6),包括膽固醇代謝的兩個核心分子SOAT1和NPC1,以及HCC31的重要生物標志物AFP和癌癥增殖和轉(zhuǎn)移相關的酪氨酸蛋白激酶SRC。但我們也發(fā)現(xiàn)9.4%的蛋白質(zhì)組與其轉(zhuǎn)錄組呈負相關(Pearson相關系數(shù)小于?0.4),其中包括DOCK6(一種可以促進癌癥化療和放射抗性的分子)和YTHDF1 (m6A甲基化的關鍵調(diào)節(jié)因子)(圖2f)。這種低相關性可能是由于蛋白質(zhì)組和轉(zhuǎn)錄組的歸一化策略不同,也可能是由多種生物學因素造成的,包括mRNA降解率、核糖體結(jié)合率、核糖體密度、密碼子使用偏好性、蛋白質(zhì)周轉(zhuǎn)率、翻譯后修飾變異、異構(gòu)體間肽共享、低豐度蛋白等。蛋白質(zhì)組和轉(zhuǎn)錄組之間存在的不一致性表明對這些細胞系進行蛋白質(zhì)組分析的必要性。
2. 肝癌細胞系的蛋白質(zhì)組學特征
MHCC97L、MHCC97H、HCCLM3、HCCLM6之間,以及HepG2和HepG2.2.15之間的通路ssGSEA評分一致性較高(圖3a)。MHCC97L、MHCC97H、HCCLM3、HCCLM6來源于同一祖細胞系MHCC9736, HepG2.2.15則來源于HepG2,具有穩(wěn)定的HBV DNA37特征?;谕?/span>ssGSEA評分的主成分分析在由主成分1(52.4%)和主成分2(16.4%)組成的二維平面上顯示:MHCC97L、MHCC97H、HCCLM3和HCCLM6幾乎重疊,與主成分1的其他細胞株距離較遠;Hep3B和PLC/PRF/5主成分2距離最大(圖3b)。主成分1中包括肌動蛋白骨架、VEGF信號通路、局灶粘附在內(nèi)的通路變化很大;主成分2中細胞周期、RNA降解和剪接體變化很大(圖3c)。此外,我們發(fā)現(xiàn)每個細胞系都有其獨特的富集通路。癌癥相關通路如Wnt信號通路、細胞周期和TGF β信號通路在不同的HCC細胞系中異質(zhì)性富集(圖3d)。在構(gòu)建細胞模型進行靶標驗證之前應考慮這些異質(zhì)性。
3. 癌細胞系保留了HCC組織的腫瘤特征
我們發(fā)現(xiàn)僅在HCC細胞系中表達的1508個蛋白組在細胞周期中富集,它們通過Rho GTPases、著絲粒、染色體和DNA修復進行信號傳遞,而在組織中唯一表達的1552個蛋白組在細胞外基質(zhì)、補體和血液中富集,這表明培養(yǎng)的HCC細胞系與組織之間的一個主要差異是缺乏細胞外微環(huán)境(圖4a,b)。相對于正常鄰近組織(NAT), HCC細胞系和腫瘤組織的表達變化具有高度相關性(Pearson相關系數(shù)等于0.7,圖4c)。詳細的通路富集分析顯示,所有HCC細胞株均保留了HCC的增殖和轉(zhuǎn)移能力,而MCC97L、MHCC97H、HCCLM3和HCCLM6完全喪失了與肝臟代謝相關的功能,提示HCC細胞株可能是HCC中更多的腫瘤亞型(圖4d)。Jiang等人發(fā)現(xiàn)21個候選藥物靶點,其中15個在這些細胞系中被檢測到,但表達特征不同:涉及增殖的藥物靶點HDAC2、CDK1、CDK2、CSNK1D在9個HCC細胞系中均高表達,而GPC3僅在HepG2.2.15、Huh7和PLC/PRF/5中被檢測到。涉及代謝的藥物靶點ALDHA8A1、PKM、SLC16A3、NPC1和SOAT1在9種HCC細胞系中均高表達。涉及轉(zhuǎn)移的藥物靶點包括SRC、PLOD2和P4HA2也在所有HCC 9個細胞系中檢測到,MMP14僅在HepG2和HepG2.2.15中低表達,TGFB1在HCCLM3中表達最高(圖4e)。
4. HCC譜庫的性質(zhì)
我們生成了一個涵蓋來自HCC細胞系和腫瘤組織的蛋白質(zhì)組的HCC譜庫,以支持DIA量化。我們計算了9株HCC細胞系不同數(shù)目(2 ~ 8)組合的覆蓋蛋白組數(shù)。對于具有特定數(shù)量的組合,選擇具有最大覆蓋蛋白組數(shù)的組合。我們發(fā)現(xiàn)HCCLM3、HepG2和PLC/PRF/5三種HCC細胞系組合所覆蓋的蛋白組數(shù)量可以覆蓋所有9種HCC細胞系所覆蓋的蛋白組的97%(圖5a)。因此,將HCCLM3、HepG2和PLC/PRF/5的多肽混合并用于譜庫生成。HCC腫瘤組織的肽混合物也用于譜庫生成。用Figshare生成的HCC譜庫包含253,921個前體,168,811個修飾肽(156,519個肽,其中150,327個肽為蛋白型)和10,098個蛋白組,其中約14.5%的蛋白組由HCC細胞系數(shù)據(jù)由依賴性采集技術(data dependent acquisition,DDA)文件提供,而17.7%的蛋白組僅由腫瘤組織的DDA文件提供(圖5b)。大約94%的前體具有6個片段離子(圖5c),前驅(qū)體荷態(tài)為+ 1 ~ + 7,其中的97%在+ 2 ~ + 4之間(圖5d)。每個蛋白質(zhì)組中具有超過2個獨特肽的蛋白質(zhì)組構(gòu)成了譜庫中蛋白質(zhì)組的95%(圖5e)。對翻譯后修飾的統(tǒng)計發(fā)現(xiàn),36741個肽(21.76%)在蛋白質(zhì)的N端發(fā)生了氨基甲基修飾,2256個肽(1.34%)在蛋白質(zhì)的N端發(fā)生了乙?;揎?,12618個肽(7.46%)在甲硫氨酸殘基上發(fā)生了氧化修飾(圖5f)。與已報道的Pan human library和DPHL library相比,我們發(fā)現(xiàn)HCC譜庫只覆蓋了515個蛋白質(zhì)基團和42,834個肽(圖5g)。
5. HCC譜庫用于DIA分析的適用性
利用HCC譜庫和優(yōu)化LC-MS/MS44參數(shù)的DIA- NN 1.8版本,對HepG2多肽進行2小時DIA分析,共鑒定出7637個蛋白質(zhì)組和82243個多肽,其中94.2%和73.4%的蛋白質(zhì)組被三次定量。同時,SpectronautTM15.2版本從相同的原始文件中鑒定出6845個蛋白質(zhì)組和73599個肽,其中的95.7%和69.6%被三次定量(圖6a)。采用DIA-NN 1.8版本和SpectronautTM15.2版本分析的重復實驗之間具有較高的定量重現(xiàn)性(Pearson相關系數(shù)大于0.9,圖6b)。然后我們分析了由HCCLM3驅(qū)動的實驗模式,發(fā)現(xiàn)EMT45的主要啟動CDH1信號下調(diào),THBS146和CDH647上調(diào),后兩種蛋白的上調(diào)分別代表了DIAA - NN 1.8版本和SpectronautTM15.2版本對EMT的激活(圖6c)。在TGFB1誘導上調(diào)的121個蛋白組中,有26個被Molecular Signatures Database v7.5.1標注為EMT標記成員,并進一步定義為TGFB1誘導的EMT基因集(圖6c)?;谠摶蚣?,我們使用ssGSEA算法計算了Jiang等人的隊列中每個患者的TGFB1-EMT評分。S-III腫瘤患者的TGFB1-EMT評分顯著高于(P<0.0001) S-I或S-II(圖6d)。根據(jù)TGFB1-EMT評分,將101例患者分為TGFB1-EMT高組(n = 14)和TGFB1-EMT低組(n = 87)。TGFB1 - EMT高組5年總生存率明顯低于TGFB1 - EMT低組(總生存率:64.3% (95%CI: 43.5%~95.0%) vs 84.0% (95%CI: 74.4%~94.8%),log-rank P值= 0.0048;TGFB1 - EMT高組與TGFB1 - EMT低組的HR為4.28 (95% CI: 1.43~12.8),P值= 0.0093(圖6e)。這些結(jié)果提示TGFB1誘導的EMT與早期HCC患者預后不良密切相關。
https://doi.org/10.1038/s41597-022-01845-x
聯(lián)系客服