An Analysis of PLA2G1B Expression and Prognosis in Patients with Lung Adenocarcinoma
-
摘要:
目的 基于数据挖掘分析PLA2G1B基因在肺腺癌患者中的表达特征、预后特征、免疫特征以及潜在的治疗方案影响。 方法 通过对TCGA以及GEO数据库中的肺腺癌患者RNAseq表达谱数据以及临床信息进行分析,对比PLA2G1B高表达和低表达在肺腺癌患者的预后差异,并通过CIBERSORT计算患者的免疫细胞浸润程度,对比PLA2G1B高低表达组之间的浸润程度差异。并通过pRRophetic算法分析2组之间的药物敏感性差异。 结果 PLA2G1B基因在肺腺癌组织中相比癌旁表达量显著降低,且表达量越低其患者的预后总生存越差,在TCGA以及2个GEO的独立验证数据集中均表现出一致的统计学差异,经多因素校正之后证明PLA2G1B低表达为差预后的独立因素(P < 0.05),且在预后较差的样本中其免疫浸润水平更低,主要表现为Bcellmemory,Tcell CD4+ memoryresting,Monocyte,Myeloiddendriticcell,Mastcellactivated细胞类型。但差预后的样本对多种化疗药物的敏感性要显著更好。 结论 PLA2G1B低表达为肺腺癌独立的差预后风险因素,且低表达患者中整体免疫浸润水平显著更低。 Abstract:Objective To analyze PLA2G1B gene expression, prognosis, immunologic features and potential therapeutic effects in patients with lung adenocarcinoma, based on the data-mining of public databases. Methods Data from TCGA and GEO database of LUAD were collected, including gene expression matrix and clinical data. The overall survival (OS) rate was compared between these two groups of PLA2G1B high expressed and low expressed. CIBERSORT algorithm was introduced to calculate totally 22 immune cells infiltration level and their difference was also compared between PLA2G1B high and low groups. Finally, pRRophetic was used to find some drugs that were probably sensitive to the worse OS groups. Results PLA2G1B was down regulated in LUAD samples and the lower expression of PLA2G1B led to a worse OS in LUAD, this result was validated in two independent GEO cohorts. After adjusting three main clinical elements, PLA2G1B was proved to be an independent prognosis biomarker (P < 0.05). For the worse OS group, we also found its immune infiltration level was lower than the better OS group, especially for B cell memory, T cell CD4+ memory resting, Monocyte, Myeloid dendritic cell and Mast activated cells. For the worse OS group, we found they might be more sensitive to several chemo drugs including Cisplatin, Docetaxel, Etoposide, Gemcitabine, Paclitaxeland Vinorelbine. Conclusion PLAG21B is an independent prognosis biomarker in LUAD and the ones low expressed showed worse OS and lower immune infiltration level. -
Key words:
- Lung adenocarcinoma /
- PLA2G1B /
- Prognosis /
- Data mining /
- Immune infiltration
-
非小细胞肺癌(non-small cell lung cancer,NSCLC)已连续多年位列全球癌症致死率榜首[1-2],而其中的肺腺癌亚型(lungadenocarcinoma,LUAD)也是非小细胞肺癌中占比最多的一类[3]。近些年,随着精准医疗的研究推进,尤其在肺腺癌领域鉴定出多个中国人群常见的驱动突变基因[4],其中以EGFR以及ALK为代表的驱动基因均已有相应的小分子抑制剂研发成功,并用于临床延缓肺腺癌患者的复发以及死亡。但是整体的肺癌患者的5 a生存率仍然较低,因此寻找更多的针对不同患者的精准治疗的靶点仍然是一个非常迫切的临床需求。
癌症通常是由基因的突变或者功能异常而驱动的,寻找到不同患者的不同异常基因,降为后续的治疗手段选择提供非常有指导意义的参考。基于EGFR驱动突变以及ALK融合变异的靶向治疗,以及通过检测PDL1表达[5-6]或者肿瘤突变负荷(Tumormutationburden)[7]而选择使用免疫治疗。这些精准诊疗精准用药的手段在临床上确实大大改善了患者的生存状态和生存率。
PLA2G1B(Phospholipase A2 group 1B)基因可以编码一种蛋白酶,其功能主要为调控细胞内的钙离子结合以及A2亚型的磷脂酶活性[8]。并且既往研究已发现肝癌中该基因会发生显著的表达上调,并且该表达上调与肝癌患者的预后相关[9]。但是在肺癌中该基因的表达模式以及与患者的预后关系尚不清楚,本研究主要通过公共数据对PLA2G1B基因全面的生物信息学分析,以解释PLA2G1B基因在肺腺癌中的表达特征、预后指导意义,并寻找潜在的治疗靶点。
1. 数据和方法
1.1 TCGA以及GEO中肺腺癌数据
本研究纳入TCGA数据库(数据下载自https://xena.ucsc.edu/)中共计490例肺腺癌原发灶的RNAseq表达量数据,其中表达量信息包含测序得到的原始序列计数(Readscount)以及定量之后的TPM(Transcriptpermillion)信息。该490例患者均具有完整的预后OS数据用于生存分析。并且纳入来自GEO(Gene expression omnibus,https://www.ncbi.nlm.nih.gov/geo/)数据库的GSE11969[10]以及GSE72094[11]两个数据集,分别包含了90以及398例肺腺癌患者的表达量数据以及临床信息。选用的数据集中患者平均年龄均大于60岁,且分期偏早期,性别分布相同,数据对比见表1、表2。
表 1 GSE11969、TCGA的年龄、分期、性别分布情况Table 1. GSE11969、TCGA age,stage,gender distribution项目 合计(n = 580) GSE11969(n = 90) TCGA(n = 490) 年龄 平均值 64.55 (10.08) 61.02 (9.80) 65.21 (10.01) 中位值 65.00(59.00、72.00) 62.00(55.00、67.00) 66.00(59.00、72.00) 不详 10 (1.72%) 0 (0.00%) 10 (2.04%) 分期n(%) Ⅰ 315 (54.31) 52 (57.78) 263 (53.67) Ⅱ 128 (22.07) 13 (14.44) 115 (23.47) Ⅲ 104 (17.93) 25 (27.78) 79 (16.12) Ⅳ 25 (4.31) 0 (0.00) 25 (5.10) 不详 8 (1.38) 0 (0.00) 8 (1.63) 性别n(%) 女 305 (52.59) 43 (47.78) 262 (53.47) 男 275 (47.41) 47 (52.22) 228 (46.53) 表 2 GSE72094、TCGA的年龄、分期、性别分布情况Table 2. GSE72094、TCGA age,stage,gender distribution overall项目 合计(n = 888) GSE72094(n = 398) TCGA(n = 490) 年龄 平均值 67.09 (9.97) 69.36 (9.45) 65.21 (10.01) 中位值 68.00(60.25、74.00) 70.00(64.00、76.00) 66.00(59.00、72.00) 不详 10 (1.13%) 0 (0.00%) 10 (2.04%) 分期n(%) Ⅰ 517 (58.22) 254 (63.82) 263 (53.67) Ⅱ 182 (20.50) 67 (16.83) 115 (23.47) Ⅲ 136 (15.32) 57 (14.32) 79 (16.12) Ⅳ 40 (4.50) 15 (3.77) 25 (5.10) 不详 13 (1.46) 5 (1.26) 8 (1.63) 性别n(%) 女 484 (54.40) 222 (55.78) 262 (53.47) 男 404 (45.50) 176 (44.22) 228 (46.53) 1.2 方法
1.2.1 数据集定义
其中来自TCGA的490例肺腺癌数据用于本研究的训练数据集(Trainingdataset),而GSE11969以及GSE72094两个数据集作为本研究的2个独立验证数据集(Independentvalidationcohort)。
1.2.2 基因表达量分析
TCGA中490例患者其中48例既有原发灶肿瘤样本的表达量,同时检测了癌旁正常肺组织的表达量信息。通过wilcoxontest检验方法对比490例肺癌样本与48例癌旁样本之间的PLA2G1B基因表达量。Pvalue小于0.05则定义为该基因在肿瘤以及癌种之间的表达量差异有统计学意义。
1.2.3 基因与患者的预后生存分析
在训练数据集以及验证数据集中,分别按照PLA2G1B基因的表达量排序,并取每个数据集中排名最低的四分之一样本为低表达量组,其余为高表达量组。然后通过log-ranktest检验分析高低表达两组患者之间的预后总生存(overall survival,OS)差异。然后同时纳入数据集中提供的患者年龄、性别、分期信息通过Coxregressiontest检验进行多因素生存分析已确定PLA2G1B的表达量高低为肺腺癌患者的独立预后因素。
1.2.4 免疫浸润分析
通过CIBERSORT算法[12]分析490例TCGA中肺腺癌患者的共计20个免疫细胞类型的浸润程度,然后分别对比每一种免疫细胞在PLA2G1B低表达和高表达两组之间的显著差异。
1.2.5 药物敏感性分析
根据PLA2G1B表达量分成低表达和高表达2组之后,使用pRRophetic算法[13]分析2组患者之间的化疗药物敏感性,该算法集合了来自CCLE的不同细胞系经过不同药物处理之后的IC50信息。通过对比不同组别之间的IC50信号差异,IC50越低则说明该药物对该类细胞的抑制作用越强。
2. 结果
2.1 PLA2G1B基因在肺腺癌组织中表达量显著下调
通过对TCGA中490例肺癌组织样本以及48例癌旁组织样本中的PLA2G1B基因表达量进行对比分析发现,在肺腺癌样本中该基因的表达量发生了显著下调(P < 0.001),见图1。
2.2 PLA2G1B表达量越低肺腺癌患者的预后越差
在TCGA的490例训练集数据中,PLA2G1B高表达组367例,低表达组123例;高表达组生存人数为247例低表达组生存人数为65例;中位生存期高表达组为1632 d,低表达组1115 d;中位随访期高表达组为670 d,低表达组为656 d。PLA2G1B基因低表达的患者其整体生存率显著低于高表达组的患者(P = 0.002,HR = 0.60,图2A),在两个独立验证数据集中同样呈现出了低表达组预后差的一致结果。GSE72094以及GSE11969中的HR分别为0.39和0.51,P<0.05,差异有统计学意义,见图2B,图2C。
2.3 多因素生存分析发现PLA2G1B基因为独立预后因素
在TCGA以及来自GEO的2个独立验证数据集中均提供了患者年龄、性别、分期信息,将三个临床潜在影响患者预后的因素以及PLA2G1B基因的表达量一起纳入多因素预后分析模型中发现,经过多因素校正之后PLA2G1B基因的表达量依然为显著影响预后的因素。在训练集以及两个独立验证数据集中均达到了差异有统计学意义(P < 0.05),结果如图3(A-TCGA训练集P = 0.003,B-验证集1GSE11969 P = 0.046,C-验证集2GSE72094P < 0.001)。
2.4 免疫细胞浸润程度分析提示PLA2G1B不同组之间免疫浸润程度有差异
通过对CIBERSORT得到的22类免疫细胞浸润程度对比分析发现,在PLA2G1B基因高表达组的患者中相比低表达组的患者显著富集Bcellmemory,Tcell CD4+ memoryresting,Monocyte,Myeloiddendriticcell,Mastcellactivated。而在低表达组中则表现为Macrophage M0/M1,Mastcellresting更为富集。该结果说明在PLA2G1B表达量不同的2组之间呈现了不同的免疫浸润类型以及浸润程度,见图4。
2.5 药物敏感性分析
为进一步研究PLA2G1B表达量不同的两组患者之间是否有药物敏感性的不同,已探索后续针对预后显著不同的这两类人群采用不同的临床治疗方案。本研究通过pRRophetic算法分析发现,在PLA2G1B低表达(即患者预后表现更差的肺腺癌患者)的细胞系中,其对铂类化合物(Cisplatin),见图5A,多西他赛(Docetaxel),见图5B,依托泊苷(Etoposide),见图5C,吉西他滨(Gemcitabine),图5D,紫杉醇(Paclitaxel),见图5E,长春瑞滨(Vinorelbine),见图5F等常见化疗药物的敏感性均更好,表现为IC50显著更低(P < 0.05)。该结果也提示临床上表现为PLA2G1B基因低表达的肺腺癌患者相比高表达的患者,有更高的可能取得临床获益。
3. 讨论
本研究基于数据挖掘对肺腺癌中PLA2G1B基因的表达特征、预后特征、免疫特征以及药物敏感性特征进行了全面分析。并发现在肺腺癌中患者的PLA2G1B基因发生了显著下调,该基因表达量的下调同时关联了肺腺癌患者的整体更差的生存表现,提示该基因的表达量越低患者的肿瘤恶性程度也存在更高的可能性。该发现不仅了490例的TCGA中大样本发现,并且在两个独立的验证数据集中进一步证实该结果的可靠性。当纳入更多的潜在影响患者临床预后表现的年龄、性别以及患者临床分期之后,该基因的预后指导作用依然显著,且同样在多个独立数据集中得到验证,进一步证明该基因的独立提示预后作用。
在既往研究中多次证明患者整体的预后表现与患者的免疫浸润程度息息相关。杀伤性免疫细胞浸润程度越高的患者其在整体的预后表现中则更好,这与免疫细胞的协助杀伤肿瘤功能相一致。而在本研究中为了解释PLA2G1B低表达的患者预后更差的潜在因素,同样进行了免疫浸润程度的分析。结果发现在低表达差预后的患者中仅有Macrophage M0/M1,Mastcellresting细胞更为富集,而在高表达好预后的患者中显著富集的免疫细胞较多,包括Bcellmemory,Tcell CD4+ memoryresting,Monocyte,Myeloiddendriticcell,Mastcellactivated。其中尤其B细胞以及CD4+T细胞均已被多次证实[14],该细胞越多越容易激活免疫反应,并行使对肿瘤细胞的杀伤功能。该结果也为PLA2G1B低表达的患者表现出较差的预后提供了一种解释,即为低表达的患者呈现较强的免疫排斥现象,有较少的免疫细胞浸润,进而免疫杀伤功能不足,影响到患者的整体预后表现。
为了进一步协助临床为低表达差预后的患者选择更为有效的治疗测序,本研究通过细胞系的药物敏感性数据分析发现,在PLA2G1B低表达的患者中其对化疗药物如铂类化合物(Cisplatin),多西他赛(Docetaxel),依托泊苷(Etoposide),吉西他滨(Gemcitabine),紫杉醇(Paclitaxel),长春瑞滨(Vinorelbine)的敏感性更好,IC50更低,该结果也为进一步的临床治疗选择提供了一定的依据。但因缺少真实患者样本的数据验证,因此该结果具有一定的局限性。
-
表 1 GSE11969、TCGA的年龄、分期、性别分布情况
Table 1. GSE11969、TCGA age,stage,gender distribution
项目 合计(n = 580) GSE11969(n = 90) TCGA(n = 490) 年龄 平均值 64.55 (10.08) 61.02 (9.80) 65.21 (10.01) 中位值 65.00(59.00、72.00) 62.00(55.00、67.00) 66.00(59.00、72.00) 不详 10 (1.72%) 0 (0.00%) 10 (2.04%) 分期n(%) Ⅰ 315 (54.31) 52 (57.78) 263 (53.67) Ⅱ 128 (22.07) 13 (14.44) 115 (23.47) Ⅲ 104 (17.93) 25 (27.78) 79 (16.12) Ⅳ 25 (4.31) 0 (0.00) 25 (5.10) 不详 8 (1.38) 0 (0.00) 8 (1.63) 性别n(%) 女 305 (52.59) 43 (47.78) 262 (53.47) 男 275 (47.41) 47 (52.22) 228 (46.53) 表 2 GSE72094、TCGA的年龄、分期、性别分布情况
Table 2. GSE72094、TCGA age,stage,gender distribution overall
项目 合计(n = 888) GSE72094(n = 398) TCGA(n = 490) 年龄 平均值 67.09 (9.97) 69.36 (9.45) 65.21 (10.01) 中位值 68.00(60.25、74.00) 70.00(64.00、76.00) 66.00(59.00、72.00) 不详 10 (1.13%) 0 (0.00%) 10 (2.04%) 分期n(%) Ⅰ 517 (58.22) 254 (63.82) 263 (53.67) Ⅱ 182 (20.50) 67 (16.83) 115 (23.47) Ⅲ 136 (15.32) 57 (14.32) 79 (16.12) Ⅳ 40 (4.50) 15 (3.77) 25 (5.10) 不详 13 (1.46) 5 (1.26) 8 (1.63) 性别n(%) 女 484 (54.40) 222 (55.78) 262 (53.47) 男 404 (45.50) 176 (44.22) 228 (46.53) -
[1] Siegel,R L,K. D. Miller,A. Jemal. Cancer statistics 2020[J]. CA Cancer J Clin,2020,70(1):7-30. doi: 10.3322/caac.21590 [2] Sung H,Ferlay J,Siegel R L,et al. Global cancer stastistics 2020:GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries[J]. CA Cancer J Clin,2021,71(3):209-249. doi: 10.3322/caac.21660 [3] Little A G,Gay E G,Gaspar L E,et al. National survey of non-small cell lung cancer in the United States:Epidemiology,pathology and patterns of care[J]. Lung Cancer,2007,57(3):253-260. doi: 10.1016/j.lungcan.2007.03.012 [4] Kleczko E K,Kwak J W,Schenk E L,et al. Targeting the complement pathway as a therapeutic strategy in lung cancer[J]. Front Immunol,2019,10(10):954. [5] Herbst R S,Soria J C,Kowanetz M,et al. Predictive correlates of response to the anti-PD-L1 antibody MPDL3280A in cancer patients[J]. Nature,2014,515(7528):563-567. doi: 10.1038/nature14011 [6] Shukuya T,Carbone D P. Predictive markers for the efficacy of anti-PD-1/PD-L1 antibodies in lung cancer[J]. J Thorac Oncol,2016,11(7):976-988. doi: 10.1016/j.jtho.2016.02.015 [7] Rizvi N A,Hellmann M D,Snyder A,et al. Cancer immunology. Mutational landscape determines sensitivity to PD-1 blockade in non-small cell lung cancer[J]. Science,2015,348(6230):124-128. doi: 10.1126/science.aaa1348 [8] Kanda A,Tamaki M,Nakamura E,et al. Characterization of recombinant human and rat pancreatic phospholipases A2 secreted from saccharomyces cerevisiae:Difference in proteolytic processing[J]. Biochim Biophys Acta,1992,1171(1):1-10. doi: 10.1016/0167-4781(92)90133-K [9] Hu B,Yang X B,Sang X T. Construction of a lipid metabolism-related and immune-associated prognostic signature for hepatocellular carcinoma[J]. Cancer Medicine,2020,9(20):7646-7662. doi: 10.1002/cam4.3353 [10] Matsuyama Y,Suzuki M,Arima C,et al. Proteasomal non-catalytic subunit PSMD2 as a potential therapeutic target in association with various clinicopathologic features in lung adenocarcinomas[J]. Mol Carcinog.,2011,50(4):301-309. doi: 10.1002/mc.20632 [11] Schabath M B,Welsh E A,Fulp W J,et al. Differential association of STK11 and TP53 with KRAS mutation-associated gene expression,proliferation and immune surveillance in lung adenocarcinoma[J]. Oncogene,2016,35(24):3209-3216. doi: 10.1038/onc.2015.375 [12] Chen B,Khodadoust M S,Liu CL,et al. Profiling tumor infiltrating immune cells with CIBERSORT[J]. Methods Mol Biol,2018,17(11):243-259. [13] Geeleher P,Cox N,Huang R S. pRRophetic:An R package for prediction of clinical chemotherapeutic response from tumor gene expression levels[J]. PloS One,2014,9(9):e107468. doi: 10.1371/journal.pone.0107468 [14] Selvanesan B C,Chandra D,Quispe-Tintaya W,et al. Listeria delivers tetanus toxoid protein to pancreatic tumors and induces cancer cell death in mice[J]. Sci Transl Med,2022,14(637):1600. doi: 10.1126/scitranslmed.abc1600 -