Application of IBS and FSI Methods in the Full Sibling Testing of Yunnan Population
-
摘要:
目的 探讨IBS法和FSI法在云南人群生物学全同胞关系鉴定中的适用性。 方法 根据 448对全同胞、1020对无关个体的19 个常染色体 STR 分型结果,运用IBS法和FSI法计算并统计各CIBS值和CFSI值。采用SPSS 25.0 软件对全同胞对和无关个体对的lgCFSI 值和CIBS值分别进行描述性统计、正态检验和t检验,对计数资料采用χ2检验。 结果 全同胞组和无关个体组的lgCFSI 值和CIBS值均符合正态分布;无关个体组和全同胞组的差异在IBS法和FSI法中均具有统计学意义;统计比较旧规范和新规范中3种阈值划分方法的差异有统计学意义(P < 0.001)。19 个常染色体STR基因座,2种规范中3种方法的系统效能分别为0.7500,0.5565和0.6625,而研究中云南人群的系统效能分别为0.7405,0.5109和0.6621。 结论 新规范在云南人群全同胞关系鉴定中具有较高的法医学应用价值,基于19个常染色体STR基因座检测系统的IBS 法和FSI法能有效降低全同胞关系鉴定的错判风险。 Abstract:Objective To explore the applicability of IBS and FSI methods in the identification of full sibling relationship in Yunnan population. Methods A total of 448 pairs of full siblings and 1020 pairs of unrelated individuals were genotyped for 19 STR loci, and CIBS and CFSI were calculated. Descriptive statistics, normality test and t-test were performed for lgCFSI values and CIBS values of whole sibling pairs and unrelated individual pairs using SPSS 25.0 software. χ2 test was used for counting data. Results The lgCFSI and CIBS values of the whole sibling group and the unrelated individual group were in normal distribution. The difference between the unrelated individual group and the full sibling group was statistically significant in both the IBS and FSI methods. The statistical comparison of the difference between the three cutt-offs dividing methods in the old and new standards is statistically significant. For 19 autosomal STR loci, the system power of the three methods in the two standards were 0.7500, 0.5565 and 0.6625, respectively, while the system power of the Yunnan population in this study were 0.7405, 0.5109 and 0.6621, respectively. Conclusion The new standard has a high value of forensic medicine application in the identification of full sibling relationship in Yunnan. The IBS method and FSI method based on 19 autosomal STR loci detection system can effectively reduce the risk of misjudgment in the identification of full sibling relationship. -
Key words:
- Full sibling /
- IBS /
- FSI
-
宫颈癌是常见的妇科恶性肿瘤之一,2020年全球癌症统计显示,宫颈癌仍是女性发病率和死亡率第四高的恶性肿瘤,全球每年新发宫颈癌病例高达60余万例,其中超过34万患者将最终死于宫颈癌[1]。早期宫颈癌以手术治疗为主,对于局部中、晚期宫颈癌,主要通过放疗和化疗的综合治疗。应用广泛的以顺铂为基础的联合化疗,治疗后大多数患者为部分缓解或缓解时间较短,超过30%的患者肿瘤持续存在、复发或转移[2],因此需要寻找新的药物或方法来提高疗效。
硫利达嗪是一种吩噻嗪类化合物,作为多巴胺受体阻断剂,曾被广泛应用于精神分裂症等精神疾病的治疗[3]。近年研究显示硫利达嗪在体外可抑制多种肿瘤细胞的增殖,如结肠癌、乳腺癌、胃癌、肝癌、胶质母细胞瘤及宫颈癌等[4-8],提示其潜在的抗肿瘤作用。在宫颈癌中,早在1988年就有应用硫利达嗪成功治疗宫颈癌患者的病例报告[9],Mao等[10]发现硫利达嗪可通过阻断多巴胺受体介导的信号转导,从而显著诱导宫颈癌SiHa细胞发生凋亡。但还未有研究从网络药理学的角度系统分析硫利达嗪抗宫颈癌的机制。因此,本研究通过生物信息学方法对硫利达嗪进行靶基因的预测,进一步分析其可能作用于宫颈癌相关的靶基因,对这些靶基因进行分析,阐明该药物可能的治疗宫颈癌的作用机制。
1. 资料与方法
1.1 硫利达嗪靶基因预测
通过PharmMapper(http://www.lilab-ecust.cn/pharmmapper/)工具预测与硫利达嗪相互作用的靶基因[11]。将硫利达嗪的SDF格式文件上传至PharmMapper服务器,利用反向分子对接方法预测硫利达嗪可能的作用靶点,靶点范围设置“Human Protein Targets Only(v2010, 2241)”,其余参数保持默认设置。匹配结果按照Normalized Fit Score打分的高低,代表小分子与蛋白药效团模型的契合程度,打分越高,说明该蛋白作为药物小分子的潜在靶标的可能性越大。本文将Normalized Fit Score设置为 > 0.7。
1.2 对靶基因进行功能分析
交互基因检索工具(Search Tool for the Retrieval of Interacting Genes,STRING))是一种用于评价蛋白相互作用的工具[12]。将预测得到的靶基因输入STRING(https://string-db.org),通过“KEGG Pathways”模块分析这些蛋白的通路富集情况,通过“Disease-gene associations(DISEASES)”模块分析疾病富集情况,通过“Tissue expression(TISSUES)”模块查看这些靶基因在不同组织的表达富集情况。
1.3 宫颈癌基因集数据获取
本研究从2个疾病数据库收集宫颈癌相关基因。GeneCards(https://www.genecards.org/)是包含有HUGO/GDB (Human Genome Organization/Genome Database)命名委员会认可的人类基因Web智能检索系统,该数据库综合了包括所有已知和预期人类基因的基因组、转录、蛋白质组、遗传和功能信息[13]。应用GeneCards数据库筛选宫颈癌相关基因,设定Score > 10为标准筛选。DisGeNET是一个综合性疾病基因数据库[14],整合了来自专家库、全基因组关联分析(Genome-wide association study,GWAS)、动物模型和相关学术文献的数据,通过“Cervical cancer”进行检索,得到宫颈癌相关基因。为获得稳健的基因集,筛选出在两个数据库中都出现的基因用于后续分析。
1.4 构建蛋白互作网络
将预测得到的硫利达嗪的靶基因与宫颈癌基因取交集,得到硫利达嗪可能影响宫颈癌的靶基因。将交互基因输入到STRING数据库,选择物种为Homo sapiens,设置置信度阈值大于0.4,检索目标基因的蛋白互作网络(protein-protein interaction,PPI),用Cytoscape3.8.2软件的cytoHubba插件分析关键节点[15],按degree数值大小选择网络中前10位的靶基因作为硫利达嗪抗癌治疗的关键节点基因。
1.5 GO和KEGG通路富集分析
对硫利达嗪预测的靶基因通过clusterProfiler软件包进行GO和KEGG通路富集分析[16],采用超几何分布计算各通路富集结果的显著性,并使用Bonferroni方法进行多重假设检验校正,按错误发现率(false discovery rate,FDR)小于0.05为阈值,对富集结果进行筛选,分析这些靶基因可能参与的生物过程、细胞组分、分子功能和通路。
1.6 相关靶基因生物学分析及重要性评估
将宫颈癌基因通过STRING工具构建蛋白互作网络,通过Cytoscape软件中的AnalyzeNetwork插件计算每个蛋白的degree值,并评估关键靶基因在整个网络中的排名。
2. 结果
2.1 硫利达嗪靶基因预测及功能分析
使用PharmMapper工具对硫利达嗪进行靶基因预测,得到可能与硫利达嗪相互作用的靶基因47个。KEGG通路富集分析,发现这些靶基因主要富集在松弛素信号通路、肿瘤相关通路、内分泌耐药、细胞衰老等(表1)。在疾病-基因关联分析结果中,排在前两位的是肿瘤和细胞增殖相关疾病(表2)。在组织表达富集中,宫颈癌细胞排在首位(表3)。
表 1 排名前10的靶基因通路分析结果Table 1. Top10 pathways results of target genesID号 名称 基因数 FDR hsa04926 松弛素信号通路 9 1.50E-08 hsa05200 肿瘤通路 13 4.88E-08 hsa01522 内分泌耐药 7 6.70E-07 hsa05205 蛋白聚糖与肿瘤 8 3.01E-06 hsa05166 人类T细胞白血病
病毒1感染8 4.18E-06 hsa04218 细胞衰老 7 6.70E-06 hsa04912 促性腺激素释放
激素信号通路6 6.70E-06 hsa04914 孕酮介导的卵
母细胞成熟6 7.36E-06 hsa05161 乙型肝炎 7 7.36E-06 hsa04933 糖尿病并发症中
的AGE-RAGE信号通路6 7.85E-06 表 2 排名前10的靶基因疾病富集分析结果Table 2. Top10 disease enrichment results of target genesID号 名称 基因数 FDR DOID:162 肿瘤 12 0.0022 DOID:14566 细胞增殖疾病 13 0.0022 DOID:4 疾病 31 0.0022 DOID:65 结缔组织疾病 10 0.0064 DOID:7 解剖实体疾病 25 0.0064 DOID:0050636 家族性内脏
淀粉样变性3 0.0183 DOID:28 内分泌系统疾病 7 0.0183 DOID:0080001 骨疾病 8 0.0184 DOID:11801 蛋白质-能量营
养不良2 0.0184 DOID:0060075 雌激素受体
阳性乳腺癌2 0.0244 表 3 排名前10的靶基因组织表达富集分析Table 3. Top10 tissue expression enrichment results of target genesID号 名称 基因数 FDR BTO:0000180 宫颈癌细胞 10 2.03E-06 BTO:0000174 胚胎结构 22 2.03E-06 BTO:0000759 肝 20 2.71E-06 BTO:0000132 血小板 10 4.54E-06 BTO:0001078 胎盘 16 4.54E-06 BTO:0001546 慢性淋巴细胞
白血病细胞8 8.77E-06 BTO:0001489 全身 46 9.93E-06 BTO:0000345 消化腺 22 1.02E-05 BTO:0001491 脏器 30 1.07E-05 BTO:0000522 腺体 34 1.77E-05 2.2 硫利达嗪与宫颈癌相关靶基因预测结果
通过GeneCards和DisGeNET数据库,得到669个宫颈癌相关基因。与硫利达嗪靶基因取交集,获得21个交互基因,见图1。
在STRING数据库的“Multiple proteins”模块中输入21个交互基因,设置置信分数 > 0.4,构建交互基因的蛋白互作网络,见图2。将PPI网络文件导入Cytoscap软件,使用cytoHubba插件分析,将结果构建成关键节点基因的PPI网络,共筛选出10个关键节点基因,见图3,分别为EGFR,PPARG,AR,NOS3,ALB,ESR1,MAPK1,MAPK14,ANXA5和MAPK8。颜色越红说明其在网络中越重要。
2.3 GO和KEGG通路富集分析结果
将21个交互基因输入clusterProfiler进行GO和KEGG富集分析。GO富集分析包括生物过程(biological process,BP)、细胞组分(cellular component,CC)和分子功能(molecular function,MF)三部分,结果见图4。生物过程主要与负离子转运的正调控、丝氨酸肽基磷酸化、类固醇代谢过程、血液凝固、细胞对化学应激的反应和脂质定位的负调控等功能有关;细胞组分主要与脂筏、膜微结构域、囊泡腔、粘着斑、钙通道复合体和电压门控钙通道复合体等有关;分子功能主要与蛋白丝氨酸/苏氨酸/酪氨酸激酶活性、核受体活性、配体激活的转录因子活性、ATP酶结合、转录共调控结合、药物结合、MAP激酶活性和RNA聚合酶II转录共调节剂结合等功能有关。
KEGG富集的通路包括调控癌症通路、松弛素信号通路、内分泌耐药、癌症中的蛋白多糖、细胞衰老、GnRH信号通路、孕酮介导的卵母细胞成熟及VEGF信号通路等,见图5。
2.4 关键靶基因重要性评估
将669个宫颈癌基因输入STRING数据库,构建PPI网络,整个网络包含525个节点和20827条边。通过Cytoscape软件对PPI网络进行分析,发现10个关键靶基因都参与其中且排名均比较靠前(表4),说明这些关键靶基因在宫颈癌PPI网络中起重要作用。
表 4 关键靶基因在宫颈癌PPI网络中的排名Table 4. Ranking of key target genes in the cervical cancer PPI network靶基因 Degree值 排名 EGFR 329 6 ALB 271 13 ESR1 255 20 ANXA5 200 32 PPARG 182 37 AR 159 53 MAPK1 143 72 MAPK14 141 77 MAPK8 138 79 NOS3 105 127 合计 525 3. 讨论
化疗是肿瘤治疗中重要的治疗手段,而现有的化疗药物特异性不高,不良反应较大,化疗强度往往与肿瘤患者耐受程度相关,极大地影响着肿瘤的治疗。因此提高化疗药物的敏感度,寻找在化疗过程中对化疗效果起着重要影响的关键基因,对肿瘤的治疗有着积极的意义。本研究首先预测了硫利达嗪的靶基因,KEGG通路富集分析结果表明,这些靶基因主要富集在肿瘤相关通路上,说明了其潜在的抗肿瘤作用。进一步分析发现硫利达嗪的靶基因主要富集在肿瘤相关疾病和宫颈癌细胞中,说明了该药物对宫颈癌具有一定的组织特异性,为进一步分析奠定了基础。
为增加结果的稳健性,笔者从两个疾病-基因数据库筛选宫颈癌基因,与硫利达嗪潜在靶点取交集,得到21个交互基因,即为硫利达嗪可能发挥治疗宫颈癌的潜在靶点,并构建了PPI网络图。通过进一步拓扑分析筛选确定了10个关键基因,结果发现这10个关键基因均与宫颈癌的进程有关。
EGFR是属于酪氨酸激酶型受体家族的糖蛋白,其不同的磷酸化位点调节各种下游信号通路,如PI3K/AKT和Ras/Raf/MEK/ERK[17],与宫颈癌的发生密切相关[18],参与了由circ-ATP8A2/miR-433/EGFR轴介导的宫颈癌进展[19]。PPARG能控制脂肪酸的过氧化物酶体β-氧化途径,是脂肪细胞分化和葡萄糖稳态的关键调节器[20],PPARG被激活后,可以促进抗癌特性,抑制宫颈癌细胞的增殖[21]。AR属于类固醇激素受体家族的成员,是配体依赖性的反式转录调节蛋白。已经证明HPV病毒编码的E6和E7蛋白可以直接与AR相互作用,在宫颈癌上皮细胞恶性转变中可能发挥协同、促进作用[22]。NOS3是钙依赖型酶,可调节血管功能[23],并且在激活的同时会产生一氧化氮,能够作用于内皮细胞,参与血管平滑肌松弛、血小板激活、血液凝固的过程[24]。ALB与肿瘤患者的营养状态、免疫功能增强及抗肿瘤密切相关,是一种潜在的药物递送系统[25]。同时,ALB会在肿瘤组织中积累,因此与之结合的药物被携带到患病组织,这降低了正常细胞的毒性作用[26]。雌激素和雌激素受体在致癌步骤中拥有持续重要的作用[27],ESR1与宫颈癌的关系涉及到发病机制、治疗及生物标志物等[28]。过表达ESR1则抑制了宫颈癌细胞的迁移和侵袭[29]。MAPKs是一系列细胞内丝氨酸/苏氨酸蛋白激酶,在进化过程中高度保守,MAPK因子在宫颈癌的进展中起着关键的生物学作用,被认为是癌症治疗干预的潜在靶点[30]。ANXA5具有抗凝活性,并参与抑制磷脂酶A和调节膜转运,调控增殖和信号转导[31]。在宫颈癌中,ANXA5可能作为内源性蛋白激酶C的抑制剂参与细胞分化、增殖和致癌作用[32]。此外,ANXA5也被证明与宫颈癌细胞的治疗效果有关[33]。重要性评估发现这些关键靶基因在宫颈癌整个PPI网络中处于相对重要位置,进一步说明了它们是宫颈癌发生的关键基因,是潜在的硫利达嗪治疗靶点。
通过KEGG富集分析,选取了10条比较显著的通路。松弛素信号通路涉及许多生物学过程,包括炎症,成肌纤维细胞活化和内皮向间充质转化,具有抑制炎症和纤维化中成纤维细胞活化的机制[34]。VEGF是促进肿瘤血管生成的主要调节因子[35],VEGF信号通路可以调控肿瘤细胞的迁移侵袭、上皮间质转化及肿瘤干细胞,是宫颈癌治疗的重要研究靶点[36]。此外,硫利达嗪具有逆转多重耐药性的作用[37],而内分泌耐药通路也出现在笔者的结果中。
本研究通过生物信息学方法预测了硫利达嗪作用于宫颈癌中的靶基因,进一步阐明了硫利达嗪对宫颈癌的可能作用机制和关键基因,初步揭示了硫利达嗪多通路、多机制治疗宫颈癌的药理学作用,为应用硫利达嗪辅助宫颈癌的治疗提供了参考依据。但由于每个数据库都有其局限性,部分作用靶点尚未有研究报道。此外,通过网络药理学的方法,不能确定硫利达嗪剂量与潜在靶标之间的相关性。因此,相关研究结果还需要后续的实验验证。
-
表 1 全同胞组和无关个体组CIBS值和lgCFSI值的
$ \bar x \pm s $ 和独立样本t检验结果($\bar x \pm s $ )Table 1. The
$ \bar x \pm s $ and independent sample t test results of the CIBS values and lgCFSI values between the full sibling group and the unrelated individual group ($\bar x \pm s $ )计算方法 数值 t值 P值 CIBS 全同胞 24.400 ± 2.834 78.000 < 0.001 无关个体 12.160 ± 2.739 lgCFSI 全同胞 6.388 ± 2.763 75.146 < 0.001 无关个体 −4.402 ± 1.909 表 2 3种方法的统计结果(n)
Table 2. Statistical results of the three methods (n)
组别 计算方法 倾向于认定
为全同胞无法给出倾
向性意见倾向于认定为
无关个体全同胞检出率 无关个体检出率 χ2 P 全同胞 方法一 379 69 0 84.60 15.879 < 0.001 方法二 332 116 0 74.11 方法三 363 85 0 81.03 无关个体 方法一 0 312 708 69.41 173.550 < 0.001 方法二 0 602 418 40.98 方法三 0 411 609 59.71 表 3 3种方法两两比较
Table 3. Pairwise comparison of three methods
计算方法 全同胞 无关个体 χ2 P χ2 P 方法二 方法一 15.047 < 0.001* 166,702 < 0.001* 方法三 6.164 0.013* 75.535 < 0.001* *P < 0.017。 -
[1] 柳燕,赵珍敏,李莉,等. 多系统联合分析应用于复杂亲缘关系鉴定[J]. 中国司法鉴定,2014,(2):61-66. [2] 边英男,侯一平,张素华,等. 《复杂亲缘关系鉴定技术研究》课题研究进展[J]. 中国司法鉴定,2018,(2):64-65. [3] 李成涛, 刘希玲, 孙宏钰, 等. 生物学全同胞关系鉴定技术规范(SF/T 0117—2021)[S]. 中华人民共和国司法部, 2017-11-17. [4] 胡利平,杜雷,张秀峰,等. 云南汉族人群20个常染色体STR基因座遗传多态性[J]. 昆明医科大学学报,2016,37(5):17-21. doi: 10.3969/j.issn.1003-4706.2016.05.005 [5] 赵书民,张素华,阙庭志,等. 两个个体间常用亲缘关系指数的统一算法[J]. 法医学杂志,2011,27(5):330-333. doi: 10.3969/j.issn.1004-5619.2011.05.004 [6] Li R,Li CT,Zhao S M,et al. Full sibling identification by IBS scoring method and establishment of the query table of its critical value[J]. Fa Yi Xue Za Zhi,2017,33(2):136-140. [7] 陆惠玲,杨庆恩. 用ITO法计算两个体间的血缘关系机会[J]. 中国法医学杂志,2002,(3):188-191. doi: 10.3969/j.issn.1001-5728.2002.03.039 [8] 徐旭,任贺,胡超辉,等. 51个常染色体STR基因座在ITO法判断全同胞中的应用[J]. 中国法医学杂志,2016,31(2):117-121,125. doi: 10.13618/j.issn.1001-5728.2016.02.002 [9] 吴微微,刘冰,郝宏蕾,等. 中国28个省/区汉族人群41个STR基因座多态性数据分析[J]. 中国法医学杂志,2016,31(1):27-32. doi: 10.13618/j.issn.1001-5728.2016.01.007 [10] 刘建兴,李利华,景强,等. 云南双江佤族、布朗族15个STR基因座遗传多态性及遗传关系分析[J]. 山东大学学报(医学版),2011,49(5):75-80+4. [11] 袁丽,任贺,李运丽,等. IBS法在全同胞和无关个体鉴定中的应用[J]. 中国法医学杂志,2020,35(5):495-498. doi: 10.13618/j.issn.1001-5728.2020.05.010 [12] Liao Y,Wu F,Hou D L,et al. Application of multiple genetic markers in determination of full and half sibling relationship:A case report[J]. Journal of Forensic Medicine,2019,35(3):319-323. [13] 陆惠玲,周科伟,吕德坚,等. ITO法和判别函数法在同胞关系鉴定中的应用[J]. 法医学杂志,2009,25(2):118-122. doi: 10.3969/j.issn.1004-5619.2009.02.012 [14] Shao C C,Yao Y N,Zhou Y Q,et al. Application of ITO method in determination of special half-sibling relationship[J]. Ournal of Forensic Medicine,2021,37(6):836-840. -