Effect of HPRT1 Gene Expression on Overall Survival of Patients with Lung Adenocarcinoma
-
摘要:
目的 探索HPRT1基因在肺腺癌中的表达特征、总生存率、功能激活以及免疫浸润中的影响。 方法 通过对TCGA肺腺癌数据以及多个GEO数据库中的肺腺癌数据进行挖掘分析,对比并验证HPRT1表达量与预后总生存(overall surival,OS)的关系,通过clusterProfiler分析HPRT1基因高表达组中上调基因的功能富集情况。且通过TIMER以及CIBERSORT算法计算肺腺癌中不同免疫细胞的浸润水平并对比在HPRT1高低表达组间的浸润程度差异。 结果 HPRT1在肺腺癌组织中表达量显著上调,且在TCGA中证明HPRT1基因高表达的患者预后OS更差(P < 0.01)。经过2个GEO数据集的验证同样发现HPRT1基因高表达表现为预后OS更差(GSE13213,P < 0.01;GSE67639,P < 0.001)。差异分析显示高表达的患者中有683个基因的表达量显著上调且这些上调基因的功能主要富集与p53以及细胞周期等癌症相关的信号通路。TIMER以及CIBERSORT算法进行的免疫细胞浸润程度分析发现在高表达差预后人群中B细胞以及CD4T细胞含量均更低(P < 0.05)。 结论 HPRT1基因表达量越高肺腺癌患者的总生存越差,且高表达患者的p53信号通路上调,B细胞以及CD4T细胞浸润程度显著下降。 Abstract:Objective To explore the expression characteristics, prognostic effect, functional activation and immune infiltration of HPRT1 gene in lung adenocarcinoma. Methods The data of adenocarcinoma of the lung from TCGA and multiple GEO databases were collected and analyzed. The relationship between HPRT1 expression level and overall survival (OS) was compared and validated, and the functional enrichment of upregulated genes in the HPRT1 high-expression group was analyzed using ClusterProfiler. Furthermore, the infiltration levels of immune cells in lung adenocarcinoma were calculated using TIMER and CIBERSORT algorithms and compared between the HPRT1 high- and low-expression groups. Results The expression of HPRT1 was significantly upregulated in lung adenocarcinoma tissues, and TCGA dataset analysis showed the patients with high expression of HPRT1 gene had a poorer overall survival (OS) prognosis (P < 0.01). Validation through two GEO datasets also shows that high expression of the HPRT1 gene is associated with a worse OS prognosis (GSE13213, P < 0.01, GSE67639, P < 0.001). Differential analysis indicates that among patients with high expression, the expression levels of 683 genes are significantly upregulated, with these upregulated genes primarily enriched in signaling pathways related to cancer, such as p53 and the cell cycle. Analysis of immune cell infiltration levels using TIMER and CIBERSORT algorithms reveals that in the group with high expression and poor prognosis, the levels of B cells and CD4 T cells are lower (P < 0.05). Conclusion The higher the expression level of the HPRT1 gene, the significantly worse the overall survival of patients with lung adenocarcinoma, and in patients with high expression levels, the p53 signaling pathway is upregulated, and the infiltration level of B cells and CD4T cells is significantly decreased. -
Key words:
- Lung Adenocarcinoma /
- HPRT1 gene /
- Overall Survival /
- Data Mining
-
近年来,随着法医学鉴定技术的发展,复杂亲缘关系鉴定需求日益增加,全同胞关系作为复杂亲缘关系的一种,指有相同生物学父亲和生物学母亲的多个子代个体之间的关系[1],目前在已在司法实践的多个领域发挥着重要的作用[2]。因此,根据实际需要,司法部司法鉴定管理局于2014年发布了《生物学全同胞关系鉴定实施规范》(SF/Z JD0105002—2014,后文简称“旧规范”),规范了基于状态一致性评分(identity by state (IBS) score)的生物学全同胞关系鉴定的技术方法,但由于旧规范中过高的系统效能和对不同群体之间的群体差异考虑的欠缺,导致在实际应用过程中存在一定的误判风险。随后,司法部于2021年发布并实施了《生物学全同胞关系鉴定技术规范》(SF/T 0117—2021 ,后文简称“新规范”)以代替旧规范。新规范相较于旧规范更新了累计状态一致性评分(CIBS)的判定阈值并降低了对应检测系统的系统效能,增加了基于等位基因频率计算的全同胞指数(full sibling index,FSI)和累积全同胞指数(CFSI)的判定阈值及相应的系统效能[3]。本文基于新旧规范中相同的19个必检基因座检测系统探讨了2份规范中3种不同全同胞鉴定阈值划分方法在系统效能上的差异以及新规范中两种方法在云南人群生物学全同胞关系鉴定中的适用性。
1. 材料与方法
1.1 样本来源
在获得知情同意的前提下,收集1468对来自昆明医科大学司法鉴定中心日常案件积累的云南人群样本(口腔拭子、血样),其中全同胞有448对,无关个体有1 020对。全同胞对为已通过旧规范中IBS法认定(包括增加20个基因座后认定为全同胞的个体对)的兄弟姐妹组合,排除了同卵双生子和STR突变的家系。无关个体对为实验室随机抽取的无亲缘关系的个体两两随机组合。
1.2 STR基因座选择及分型检测
案件鉴定用Chelex-100 法提取血样 DNA,采用Promega公司PowerPlex®21 System试剂盒进行扩增,扩增产物经 ABI3130XL型基因分析仪电泳分离,应用ABI GeneMapperID- 1.5软件分析。每个样本均得到D3S1358、 D1S1656、 D6S1043、 D13S317、 Penta E、D16S539、D18S51、D2S1338、CSF1PO、PentaD、 TH01、 vWA、 D21S11、 D7S820、 D5S818、 TPOX、 D8S1179、 D12S391、 D19S433、 FGA 和 Amelogenin 共21个STR基因座的分型结果,包含全同胞鉴定规范中的19个必检基因座。
1.3 计算累计状态一致性评分
两名有争议个体在同一STR基因座上出现相同等位基因的个数就是状态一致性评分。当采用包含多个相互独立的常染色体遗传标记分型系统对两名有争议个体进行检测时,各个遗传标记上IBS之和即称为累计状态一致性评分[3]。利用全同胞鉴定规范中状态一致性评分方法,分别计算每对全同胞和无关个体之间19个必检基因座的CIBS值,并对数据进行统计整理。
1.4 计算累积全同胞指数
对于每一个STR基因座而言,两名有争议个体之间存在全同胞关系时其基因型出现的机率与两名有争议个体之间为无关个体时其基因型出现的机率之比值即为全同胞指数。当采用包含多个相互独立的常染色体遗传标记分型系统对两名有争议个体进行检测时,各个遗传标记上FSI的乘积即称为常染色体STR基因座累积全同胞关系指数[3]。根据云南汉族人群中 19个常染色体STR基因座的等位基因频率资料[4]和新规范中全同胞指数和累积全同胞关系指数的算法[5],分别计算全同胞组和无关个体组的配对个体之间19个必检基因座的CFSI值,并对数据进行统计整理。
1.5 3种方法的阈值划分
基于新旧规范,用IBS法和FSI法分别计算1468对样本的全同胞关系,并对计算结果按照以下三种方法进行划分:方法一以旧规范中 IBS ≥ 22 倾向于认为两名被鉴定人为全同胞,IBS ≤ 13 倾向于认为两名被鉴定人为无关个体和13 < IBS < 22无法给出倾向性意见为标准进行阈值划分;方法二以新规范中IBS>22倾向于认为两名有争议个体为全同胞关系,IBS < 12倾向于认为两名有争议个体为无关个体对和12 ≤ IBS ≤ 22无法给出倾向性意见为标准进行阈值划分;方法三以新规范中FSI>1.0×104倾向于认为两名有争议个体为全同胞关系,FSI < 1.0×10-4倾向于认为两名有争议个体为无关个体对和1.0×10-4 ≤ FSI ≤ 1.0×104无法给出倾向性意见为标准进行阈值划分。
1.6 统计学处理
采用SPSS 25.0软件对全同胞组和无关个体组的lgCFSI 值和CIBS值的分布进行正态检验后,统计不同组别lgCFSI 值和CIBS值的算数均数和标准差,并对其进行独立样本t 检验,对计数资料采用χ2检验,均以P < 0.05为差异有统计学意义。
2. 结果
2.1 CIBS值和CFSI值的分布
根据448对全同胞和1020对无关个体的CIBS值和对CFSI值经对数转换后的lgCFSI值进行正态检验,结果表明全同胞组和无关个体组的CIBS值及lgFSI值均符合正态分布(图1,图2)。
2.2 无关个体组与全同胞组的差异
统计并描述全同胞组和无关个体组CIBS值和lgCFSI值的算数均数、标准差、t值(表1),结果显示无关个体组与全同胞组在CIBS值与lgCFSI值的差异均有统计学意义,P < 0.001。
表 1 全同胞组和无关个体组CIBS值和lgCFSI值的$ \bar x \pm s $ 和独立样本t检验结果($\bar x \pm s $ )Table 1. The$ \bar x \pm s $ and independent sample t test results of the CIBS values and lgCFSI values between the full sibling group and the unrelated individual group ($\bar x \pm s $ )计算方法 数值 t值 P值 CIBS 全同胞 24.400 ± 2.834 78.000 < 0.001 无关个体 12.160 ± 2.739 lgCFSI 全同胞 6.388 ± 2.763 75.146 < 0.001 无关个体 −4.402 ± 1.909 2.3 3种方法的统计结果及差异
分别按照3种方法对全同胞组和无关个体组的计算结果进行统计整理和χ2 检验(表2),显示方法一有1087对样本可以得到倾向性意见,有381对样本无法得出倾向性意见,实际检出率为74.05%;方法二有750对样本可以得到倾向性意见,有718对样本无法得出倾向性意见,实际检出率为51.09%;方法三有972对样本可以得到倾向性意见,有496对样本无法得出倾向性意见,实际检出率为66.21%。3种方法在19个常染色体STR基因座检测水平上的全同胞组检测准确率和无关个体组检测准确率均为100%。3种方法的χ2检验结果显示在全同胞组和无关个体组中,3种方法的检出率不完全相同,差异有统计学意义。对2个组别中3种方法的检出率进行方法二与方法一和方法三的比较(表3),通过Bonferroni方法进行校正,结果显示在2个组别中方法二与方法一和方法三的差异均有统计学意义。
表 2 3种方法的统计结果(n)Table 2. Statistical results of the three methods (n)组别 计算方法 倾向于认定
为全同胞无法给出倾
向性意见倾向于认定为
无关个体全同胞检出率 无关个体检出率 χ2 P 全同胞 方法一 379 69 0 84.60 15.879 < 0.001 方法二 332 116 0 74.11 方法三 363 85 0 81.03 无关个体 方法一 0 312 708 69.41 173.550 < 0.001 方法二 0 602 418 40.98 方法三 0 411 609 59.71 表 3 3种方法两两比较Table 3. Pairwise comparison of three methods计算方法 全同胞 无关个体 χ2 P χ2 P 方法二 方法一 15.047 < 0.001* 166,702 < 0.001* 方法三 6.164 0.013* 75.535 < 0.001* *P < 0.017。 3. 讨论
对于同样的19个常染色体STR基因座检测系统,以上不同全同胞鉴定阈值划分方法的系统效能在两份规范中分别为0.7500,0.5565和0.6625;在云南人群中的系统效能分别为0.7405,0.5109和0.6621。比较新旧规范中IBS法的应用,因CIBS阈值划分标准不同,两种方法的系统效能相差约0.1935,在云南人群中2种方法的系统效能相差约0.2269。在新规范中减少的这部分系统效能是由于更新的规范中将个体对的得分为“CIBS = 12”、“CIBS = 13”、“CIBS = 22”时判定为“无法给出倾向性意见”,同时靠近阈值附近的个体对数也明显较多,从而导致两种方法的系统效能相差较大。新规范降低了IBS法判定全同胞关系的系统效能,降低了误判率,使得全同胞鉴定时给出肯定意见的准确性有所提高[6]。
FSI法对于全同胞关系指数的计算由ITO法提供[7],用以判定两名有争议个体是否为全同胞关系的方法。该方法的计算过程较IBS法稍显复杂,但FSI法考虑到了人群群体遗传学差异,基于不同人群等位基因频率在某一检测系统下进行计算,因此能有效避免全同胞关系鉴定中的误判,增加结果的可信度[8]。本研究基于新规范以及文献报道的云南人群的等位基因频率,在19个常染色体STR基因座检测系统下,通过FSI法计算的系统效能均高于IBS法。同时,比较全同胞组和无关个体组的正态分布曲线,lgCFSI值的重叠范围和比例明显小于CIBS值的重叠范围和比例,也说明FSI法能对全同胞和无关个体进行更有效的区分。
本研究考虑到实际鉴定中,不同人群同一基因座上等位基因频率分布的差异会使得同一基因座的个体识别能力有所不同[9],从而导致同一检测系统在不同人群中的系统效能有一定差异的情况。应用新规范中IBS法和FSI法在19个常染色体STR检测系统上对1468对云南人群样本进行了全同胞关系鉴定,计算所得在云南人群中两种方法的系统效能分别为0.5109和0.6621与新规范中同一检测系统下对应方法的系统效能0.5565和0.6625相近,说明新规范在云南人群中有很高的应用价值。对于云南地区少数民族聚集,不同的少数民族间或有部分等位基因频率存在较大差异的情况[10],新规范规定,当某个基因座的个体识别能力与规范中存在较大差异时,可以在准确性不低于99.99%的前提下重新计算并制定全同胞关系鉴定的CIBS阈值,这也能有效解决新规范在各地区人群中实际应用的局限。
对于无法给出倾向性意见可补充检测基因座,以增加能给出倾向性意见的可能性[11]。新规范中也给出了基于19个常染色体STR基因座依次补充36个与其不存在连锁不平衡的常染色体基因座后相应的检测系统效能,对于IBS法和FSI法其最高系统效能分别可达0.9986和0.9965[3],能有效区分全同胞和无关个体。对于特殊的鉴定案件,还可补充检验X染色体、Y染色体或线粒体DNA遗传标记的情况[12],但应该根据其遗传规律采用文字描述的方式进行分析说明。
本研究发现,基于19个常染色体STR基因座检测系统,新规范在云南人群全同胞关系鉴定中具有较高的法医学应用价值;相较于旧规范,新规范中的IBS法和FSI法能有效降低全同胞关系鉴定的错判风险。由于IBS法和FSI法在计算原理上的差异 ,本文建议实际应用中将IBS法和FSI法相结合,对结果进行更为科学和准确的判断。需要注意的是,无论新规范还是旧规范均只适用于同父同母的全同胞关系鉴定,对于半同胞关系的判别并不适用。实际案件中如遇到不确定为全同胞的情况,可通过ITO法对全同胞和半同胞关系进行判别[13-14],从而得出相应结论。
-
-
[1] Tewari K S,Colombo N,Monk B J,et al. Pembrolizumab or placebo plus chemotherapy with or without bevacizumab for persistent,recurrent,or metastatic cervical cancer: Subgroup analyses from the KEYNOTE-826 randomized clinical trial[J]. JAMA Oncol,2024,10(2):185-192. doi: 10.1001/jamaoncol.2023.5410 [2] Ma W,Zeng J,Montoya D J,et al. Labyrinthin expression is associated with poor prognosis in patients with non-small cell lung cancer[J]. Cancers (Basel),2023,15(3):924. doi: 10.3390/cancers15030924 [3] Wang X S,Bai Y F,Verma V,et al. Randomized trial of first-line tyrosine kinase inhibitor with or without radiotherapy for synchronous oligometastatic EGFR-mutated non-small cell lung cancer[J]. J Natl Cancer Inst,2023,115(6):742-748. doi: 10.1093/jnci/djac015 [4] Chen F,Byrd A L,Liu J,et al. Polycomb deficiency drives a FOXP2-high aggressive state targetable by epigenetic inhibitors[J]. Nat Commun,2023,14(1):336. doi: 10.1038/s41467-023-35784-x [5] John P,Sudandiradoss C. A comprehensive integrated gene network construction to explore the essential role of Notch 1 in lung adenocarcinoma (LUAD)[J]. J Biomol Struct Dyn,2024,1-13. [6] Xu H,Hu Y,Peng X,et al. Prediction of prognostic and immune therapy response in lung adenocarcinoma based on MHC-I-related genes[J]. Immunopharmacol Immunotoxicol,2024,46(1):93-106. doi: 10.1080/08923973.2023.2261146 [7] Gurioli G,Conteduca V,Brighi N,et al. Circulating tumor cell gene expression and plasma AR gene copy number as biomarkers for castration-resistant prostate cancer patients treated with cabazitaxel[J]. BMC Med,2022,20(1):48. doi: 10.1186/s12916-022-02244-0 [8] Miao J,Kang L,Lan T,et al. Identification of optimal reference genes in golden Syrian hamster with ethanol- and palmitoleic acid-induced acute pancreatitis using quantitative real-time polymerase chain reaction[J]. Animal Model Exp Med,2023,6(6):609-618. doi: 10.1002/ame2.12321 [9] Chen L,He X,Yi S,et al. Six glycolysis-related genes as prognostic risk markers can predict the prognosis of patients with head and neck squamous cell carcinoma[J]. Biomed Res Int,2021,2021:8824195. [10] Gurioli G, Conteduca V, Brighi N, et al. Circulating tumor cell gene expression and plasma AR gene copy number as biomarkers for castration-resistant prostate cancer patients treated with cabazitaxel[J]. BMC Med,2022,20(1):48. [11] Goldman M J,Craft B,Hastie M,et al. Visualizing and interpreting cancer genomics data via the Xena platform[J]. Nat Biotechnol,2020,38(6):675-678. doi: 10.1038/s41587-020-0546-8 [12] Tomida S,Takeuchi T,Shimada Y,et al. Relapse-related molecular signature in lung adenocarcinomas identifies patients with dismal prognosis[J]. J Clin Oncol,2009,27(17):2793-2799. doi: 10.1200/JCO.2008.19.7053 [13] Gentles A J,Bratman S V,Diehn M,et al. Integrating tumor and stromal gene expression signatures with clinical indices for survival stratification of early-stage non-small cell lung cancer[J]. J Natl Cancer Inst,2015,107(10):djv211. doi: 10.1093/jnci/djv211 [14] Uhlen M,Zhang C,Lee S,et al. A pathology atlas of the human cancer transcriptome[J]. Science,2017,357(6352):eaan2507. doi: 10.1126/science.aan2507 [15] Yan Z,Wang Q,Lu Z,et al. OSluca: An interactive web server to evaluate prognostic biomarkers for lung cancer[J]. Front Genet,2020,11:420. doi: 10.3389/fgene.2020.00420 [16] Yu G,Wang L G,Han Y,et al. clusterProfiler: An R package for comparing biological themes among gene clusters[J]. OMICS,2012,16(5):284-287. doi: 10.1089/omi.2011.0118 [17] Wu M,Jiang L. Hydroxysteroid 17-beta dehydrogenase 6 is a prognostic biomarker and correlates with immune infiltrates in hepatocellular carcinoma[J]. Dig Dis Sci,2022,67(1):146-158. doi: 10.1007/s10620-021-06832-7 [18] Chen B,Khodadoust M S,Liu C L,et al. Profiling tumor infiltrating immune cells with CIBERSORT[J]. Methods Mol Biol,2018,1711:243-259. [19] Mavridis K,Stravodimos K,Scorilas A. Quantified KLK15 gene expression levels discriminate prostate cancer from benign tumors and constitute a novel independent predictor of disease progression[J]. Prostate,2013,73(11):1191-201. doi: 10.1002/pros.22667 [20] 朱中山,杨洲,江承川,等. 肺腺癌患者PLA2G1B表达情况与预后的相关性[J]. 昆明医科大学学报,2022,43(9):70-76. -