留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

决策树及Logistic回归模型在活动性肺结核预测中的应用

樊浩 刘幸 张乐 李畏娴 吴雪娇 韩祎 姚晓蝶

樊浩, 刘幸, 张乐, 李畏娴, 吴雪娇, 韩祎, 姚晓蝶. 决策树及Logistic回归模型在活动性肺结核预测中的应用[J]. 昆明医科大学学报, 2023, 44(9): 25-31. doi: 10.12259/j.issn.2095-610X.S20230916
引用本文: 樊浩, 刘幸, 张乐, 李畏娴, 吴雪娇, 韩祎, 姚晓蝶. 决策树及Logistic回归模型在活动性肺结核预测中的应用[J]. 昆明医科大学学报, 2023, 44(9): 25-31. doi: 10.12259/j.issn.2095-610X.S20230916
Hao FAN, Xing LIU, Le ZHANG, Weixian LI, Xuejiao WU, Yi HAN, Xiaodie YAO. Applications of Decision Tree Models and Logistic Regression in the Prediction of Active Tuberculosis[J]. Journal of Kunming Medical University, 2023, 44(9): 25-31. doi: 10.12259/j.issn.2095-610X.S20230916
Citation: Hao FAN, Xing LIU, Le ZHANG, Weixian LI, Xuejiao WU, Yi HAN, Xiaodie YAO. Applications of Decision Tree Models and Logistic Regression in the Prediction of Active Tuberculosis[J]. Journal of Kunming Medical University, 2023, 44(9): 25-31. doi: 10.12259/j.issn.2095-610X.S20230916

决策树及Logistic回归模型在活动性肺结核预测中的应用

doi: 10.12259/j.issn.2095-610X.S20230916
基金项目: 昆明市卫生科研基金资助项目(2021-03-02-003,2021-03-08-006);昆明市卫生科技人才培养十百千工程基金资助项目(2021-SW-13)
详细信息
    作者简介:

    樊浩(1997~),男,云南曲靖人,在读硕士研究生,主要从事临床药学研究工作

    通讯作者:

    刘幸,E-mail:254914514@qq.com;张乐,E-mail:9035643@qq.com

  • 中图分类号: R33

Applications of Decision Tree Models and Logistic Regression in the Prediction of Active Tuberculosis

  • 摘要:   目的   采用决策树模型与Logistic回归模型分析活动性肺结核(active tuberculosis,ATB)的危险因素,为ATB的预防控制提供参考依据。  方法   实验组为2021年3月至2023年3月昆明市第三人民医院收治的200例活动性肺结核患者,对照组为同期200例健康体检者,建立Logistic回归和决策树ATB风险预测模型,并在是否基于 Logistic 回归结果条件下建立决策树分析模型(决策树1和决策树2),用受试者工作曲线评价3种模型的预测效果。  结果   Logistic回归结果显示AAT、IL-4、IL-6、IL-17、IFN-γ是发生ATB的危险因素,CD+4为保护因素,决策树1分析结果显示CRP为根节点,其后分别以IL-1、IL-6、CD+4、IL-17、AGP、IFN-γ作为子节点,决策树2分析结果显示IL-6作为根节点,其后是AAT、IL-4、IL-17作为子节点。建立的风险预测模型显示,Logistic回归的AUC为0.887,决策树模型的AUC 分别为0.900(决策树1)和0.857(决策树2)。3组模型的AUC比较结果显示,决策树1的AUC优于决策树2(95%CI:0.0019~0.0841,P < 0.05),但与Logistic回归模型比较,差异无统计学意义(95%CI:0.0265~0.0522,P = 0.526)。  结论   Logistic模型和决策树1模型在预测ATB危险因素时均有一定的应用价值,建议将2种模型结合使用,以便更好地为ATB的防治提供参考价值。
  • 结核病死亡人数在传染性疾病领域位列第一,也是全球第十三大死亡原因之一,2022年WHO全球结核病报告中提到,全球结核病每日死亡人数已超过新型冠状病毒感染死亡的人数[1],预计2023年结核病将取代新型冠状病毒再次成为全球单一传染源的主要死亡原因[2]。其中结核病患者病原体检测的全球平均阳性率为57%,在贫困的农村地区,这一比例更低[3]。因此,发展中国家的结核病控制组织和患者(特别是痰呈阴性的患者)迫切需要快速、准确、简单和廉价的活动性肺结核(active tuberculosis,ATB)检测方法。

    痰涂片检查是诊断活动性结核病最常用的细菌学方法,同时也是检测结核分枝杆菌(mycobacterium tuberculosis,MTB)的金标准,但该方法灵敏度较低,且需要4~6周才能得到结果,这不适用于快速检测MTB [4]。与之相比,核酸检测技术的优势在于其表现出较高的灵敏度,特别是在提高速度的同时,还能保持结核确诊的准确性。但核酸检测的诊断方法所需的设备、设施和试剂成本较高,一定程度上限制了它们的广泛应用[5]

    血液的异常结果可以预示患者存在血液疾病和结核分枝杆菌感染。常规血检可广泛用于活动性肺结核的检测。然而,常规血液检测结果的使用可能需要不断的完善才能有效地帮助ATB的诊断。既往研究表明,炎性蛋白、细胞因子、淋巴细胞等单一常规血液标志物可能有助于识别ATB[6-7],但这些标志物作为诊断标志物时的敏感性和特异性相对较低,假阳性率较高,不适用于快速、准确的诊断。本研究旨在利用广泛可用的生物标志物组合构建决策树和Logistic回归预测模型,并评估这些模型的预测价值,为ATB的防治提供参考依据。

    实验组:以2021年3月至2023年3月期间昆明市第三人民医院收治的活动性肺结核患者200例,男性113例,女性87例,平均年龄(48.94±18.20)岁。对照组:以同期健康体检者200例,男性105例,女性95例,平均年龄(45.83±15.50)岁。

    全部ATB患者按照《肺结核诊断标准》(WS288-2017)[8]:痰MTB培养阳性、MTB核酸检测阳性、胸部影像学检查、病理学检查等确诊为活动性肺结核的患者,排除标准[9]:(1)患有心脏、肝脏、肾脏等重要脏器性疾病;(2)合并HIV和细胞免疫缺陷;(3)合并其他细菌感染;(5)合并严重循环功能障碍。

    使用昆明市第三人民医院信息管理系统进行电子查阅,收集患者的临床资料,具体包括年龄、性别、免疫球蛋白A(IgA)、免疫球蛋白M(IgM)、免疫球蛋白G(IgG)、触珠蛋白(HAP)、α1抗胰蛋白酶(AAT)、α1酸性糖蛋白(AGP)、干扰素γ(IFN-γ)、肿瘤坏死因子α(TNF-α)、干扰素α(IFN-α)、白介素-1(IL-1)、白介素-2(IL-2)、白介素-4(IL-4)、白介素-5(IL-5)、白介素-6(IL-6)、白介素-8(IL-8)、白介素-10(IL-10)、白介素-12p70(IL-12p70)、白介素-17(IL-17)、CD+3淋巴细胞绝对数(CD+3)、CD+4淋巴细胞绝对数(CD+4)、CD+8淋巴细胞绝对数(CD+8)、CD+4淋巴细胞与CD+8淋巴细胞的比值(CD+4/ CD+8)、C反应蛋白(CRP),并完成录入、建立数据库和统计分析等工作。

    分别在是否根据二元Logistic回归结果的条件下建立决策树模型。决策树1纳入单因素分析中有统计学意义的因子,根据Logistics回归结果建立的决策树模型命名为决策树2,采用SPSS 27.0软件建立树模型。条件设定选项中父节点最小个案数为20,子节点最小个案数为5。

    数据处理软件为SPSS Statistics 27.0统计软件。计数资料用“比值比[n(%)]”描述,计量资料以“中位数(四分位数)[M(P25,P75)]”表示,选择秩和检验。以P < 0.05为差异有统计学意义。单因素中具有统计学意义的因子纳入二元Logistic回归,建立L ogistic回归模型,并使用MedCalc19.8统计软件比较3组ROC曲线下面积。

    本实验数据皆为偏态分布,选用秩和检验,分析结果显示,各组间年龄、男女构成比情况比较,差异均无统计学意义(P < 0.05)。2组间CRP、TNF-α、AGP、AAT、HAP、IgM、CD+3、CD+4、CD+8、IL-1、IL-2、IFN-γ、IL-4、IL-5、IL-6、IL-10、IL-17,差异具有统计学意义(P < 0.05),见表1

    表  1  实验组与对照组单因素分析结果[n(%)/M(P25,P75)]
    Table  1.  Results of one-way analysis of variance between experimental and control groups [n(%)/M(P25,P75)]
    变量实验组(n = 200)对照组(n = 200)Z/χ2P
    性别
     男 113(56.5) 105(52.5) 0.645 0.422
     女 87(43.5) 95(47.5)
    年龄 51(33,64) 46(33,56) 3.156 0.076
    CRP 14.90(3.84,36.63) 1.30(0.70,2.70) 127.649 < 0.001**
    AGP 96.55(59.68,141.68) 56.05(43.70,68.38) 76.779 < 0.001**
    AAT 181.30(139.70,231.67) 133.05(114.55,151.00) 97.390 < 0.001**
    HAP 177.10(90.18,256.18) 95.50(62.60,142.73) 48.632 < 0.001**
    IgG 11.59(9.82,13.66) 11.18(9.84,13.14) 0.417 0.518
    IgM 0.97(0.69,1.33) 1.04(0.76,1.50) 3.830 0.050*
    IgA 1.89(1.24,2.66) 1.59(1.06,2.18) 10.184 0.001**
    CD+3 973.50(627.25,1277.50) 1239.59(976.67,1616.00) 43.275 < 0.001**
    CD+4 540.00(355.25,715.72) 750.47(563.75,897.52) 53.021 < 0.001**
    CD+8 371.52(230.25,555.96) 461.77(337.30,650.06) 19.923 < 0.001**
    CD+4/CD+8 1.49(1.03,1.99) 1.59(1.23,1.96) 2.657 0.103
    IL-1 3.20(1.60,7.22) 2.15(1.27,6.12) 11.009 < 0.001**
    IL-2 1.79(1.18,3.10) 1.43(0.99,2.21) 11.824 < 0.001**
    IL-4 1.37(0.96,1.88) 1.25(0.93,1.72) 3.920 0.048*
    IL-5 2.34(1.36,3.48) 1.46(0.93,2.36) 29.267 < 0.001**
    IL-6 9.18(3.31,26.41) 2.66(1.46,4.44) 104.701 < 0.001**
    IL-8 3.40(1.72,14.56) 3.66(1.44,11.32) 2.751 0.097
    IL-10 1.59(1.26,2.80) 1.51(0.97,2.52) 6.529 0.011*
    IL-12 1.64(1.25,2.26) 1.48(1.13,2.10) 2.584 0.108
    IL-17 2.15(1.34,6.44) 1.83(1.30,3.63) 4.385 0.036*
    IFN-γ 9.48(3.11,20.60) 3.19(1.80,6.34) 63.377 < 0.001**
    IFN-α 1.99(1.32,5.23) 2.00(1.26,3.91) 2.201 0.138
    TNF-α 1.98(1.39,3.87) 1.82(1.28,2.50) 8.049 0.005**
      *P < 0.05;**P < 0.01。
    下载: 导出CSV 
    | 显示表格

    根据单因素分析结果,将P < 0.05的变量纳入二元Logistic回归分析。结果显示,共筛选出6个独立影响因素AAT、IL-4、IL-6、IL-17、IFN-γ、CD+4,见表2

    表  2  活动性肺结核影响因素的二元Logistics回归分析
    Table  2.  Binary Logistic regression analysis of factors influencing ATB
    项目βS.E.WaldPOR95%CI
    CRP 0.003 0.011 0.089 0.765 1.003 0.982~1.026
    AGP 0.005 0.006 0.699 0.403 1.005 0.994~1.016
    AAT 0.012 0.005 5.559 0.018* 1.012 1.002~1.023
    HAP 0.001 0.003 0.217 0.641 1.001 0.996~1.006
    IgA −0.018 0.081 0.051 0.821 0.982 0.838~1.105
    CD+3 0.002 0.002 1.822 0.177 1.002 0.999~1.006
    CD+4 −0.004 0.002 4.861 0.027* 0.996 0.992~1.000
    CD+8 −0.002 0.002 0.941 0.332 0.998 0.994~1.002
    IL-1 −0.055 0.028 3.816 0.051 0.947 0.896~1.000
    IL-2 0.134 0.082 2.677 0.102 1.143 0.974~1.342
    IL-4 0.314 0.133 5.571 0.018* 1.369 1.055~1.777
    IL-5 0.162 0.094 2.976 0.084 1.176 0.978~1.413
    IL-6 0.171 0.045 14.075 < 0.001** 1.186 1.085~1.296
    IL-10 −0.095 0.095 0.999 0.318 0.909 0.755~1.069
    IL-17 0.074 0.028 7.190 0.007** 1.077 1.020~1.136
    IFN-γ 0.034 0.017 3.909 0.048* 1.034 1.000~1.069
    TNF-α 0.033 0.092 0.128 0.721 1.033 0.863~1.237
    常量 −3.754 0.919 16.695 0.000 0.023
      *P < 0.05;**P < 0.01。
    下载: 导出CSV 
    | 显示表格

    根据单因素分析结果中有统计学差异的变量建立决策树,结果显示决策树1分为3层,见图1。与活动性肺结核相关的危险因素依次为CRP、IL-1、IL-6、CD+4、IL-17、AGP、IFN-γ。树状结构的第一层为CRP,CRP > 24.2 mg/L的人群活动性肺结核患病率较高为94.3%。CRP值在3.1 mg/L < CRP < 24.2 mg/L的人群中IL-6对活动性肺结核的影响有统计学意义(P < 0.01),IL-6绝对值 > 12.25 Pg/mL的人群活动性肺结核患病率达100%。将Logistic 回归分析结果中P < 0.05的变量AAT、IL-4、IL-6、IL-17、IFN-γ、CD+4纳入决策树分析(决策树2),结果显示,决策树模型2以IL-6作为根节点,其后是AAT、IL-4、IL-17作为子节点,见图2

    图  1  活动性肺结核影响因素决策树模型1
    Figure  1.  Decision tree model 1 of factors influencing ATB
    图  2  活动性肺结核影响因素决策树模型2
    Figure  2.  Decision tree model 2 of factors influencing ATB

    Logistic回归模型AUC为0.887(95%CI:0.852~0.917),预测准确度为84.1%。模型集决策树分析结果显示,决策树1的AUC为0.900(95%CI:0.867~0.928),预测准确度为85.2%;决策树2的AUC为0.957(95%CI:0.819~0.890),预测准确度为83.8%,见图3表3。结果显示:3组模型对活动性肺结核均有一定的预测价值。

    图  3  3组模型ROC曲线下面积比较
    Figure  3.  Comparison of the area under the ROC curve for the three model groups
    表  3  3组模型ROC曲线下面积
    Table  3.  the area under the ROC curve for the three groups of models
    模型AUC标准误P95%CI准确度(%)敏感度(%)特异度(%)约登指数
    Logistic0.8870.0174 < 0.001**0.852~0.91784.192.075.50.675
    决策树10.9000.0158 < 0.001**0.867~0.92885.282.583.50.660
    决策树20.8570.0185 < 0.001**0.819~0.89083.886.575.50.620
      **P < 0.01。
    下载: 导出CSV 
    | 显示表格

    3组模型的AUC比较结果显示,决策树1的AUC优于决策树2(95%CI:0.0019~0.0841,P < 0.05),但决策树1的AUC与Logistic模型AUC比较差异无统计学意义(95%CI:0.026~0.052,P = 0.526),见表4

    表  4  3组模型ROC曲线下面积比较结果
    Table  4.  Comparison of the results of the area under the ROC curve for the three groups of models
    组别曲线下面积差值标准误ZP95%CI
    Logistic VS 决策树10.0130.0200.6340.5260.026~0.052
    Logistic VS 决策树20.0300.0171.7740.0760.003~0.064
    决策树1 VS 决策树20.0430.0221.9330.049*0.001~0.084
      *P < 0.05。
    下载: 导出CSV 
    | 显示表格

    虽然新型冠状病毒的管控措施有效控制了结核病的传播,但新冠肺炎疫情导致的ATB基本服务的中断、MTB检测的暂停、更广泛的ATB预测因素(例如营养不良、贫困和人均收入)等,严重影响着结核病的发病率和死亡率[10]。2020年和2021年我国新发结核病报告中病例的减少也预示着未诊断和治疗的结核患者例数将有所增加,将直接导致结核病死亡病例数增加和更多的社区传染传播。因此,明确ATB的主要危险因素,对其防控有着重要的价值。

    本研究建立了ATB的风险预测模型(决策树模型和Logistic回归模型)并进行了对比,旨在为ATB早期诊断提供参考。决策树模型与Logistic回归模型都突出了CD+4、IL-6、IL-17、IFN-γ等对ATB的影响,而在Logistic回归模型中有意义的变量AAT和IL-4,并未进入决策树的节点。考虑受决策树深度值设置的限制,这些变量可能在更深的节点才会显示。此外有研究者明确指出Logistic回归与决策树模型在算法上有明显差异[11],主要体现在Logistic回归擅长分析线性关系, 专注于拟合整体关系,比决策树能更好的分析数据的整体结构,但对极端值更加敏感,容易受到极端值的影响。另一方面,由于决策树使用的是分割的方法,因此能更深入地了解数据的细节[12],但同时失去了对全局的把握,对多变量同时检验的能力明显低于Logistic。

    本研究表明,在决策树模型中CRP是ATB的最强预测因子。CRP是临床研究中最常见的炎性标志物,当MTB入侵机体时,由肝脏产生大量的反应蛋白用于激活补体、调节吞噬细胞功能等[13],表明CRP可作为ATB的敏感指标,这与Rohini K研究结果相符[14]。本研究也显示IL-4、IL-6、IL-17是ATB的危险因素。在CRP及刺激信号影响下,机体特定细胞被激活,释放TNF-α,继而激活其他炎性因子,引发瀑布效应,通过局部应激细胞聚集,促进巨噬细胞活化,提高吞噬能力[15],当巨噬细胞被激活后释放TNF-α,机体IL-1、IL-6水平升高,促进肉芽肿组织形成,并有助于控制MTB感染[16]。CD+4细胞在结核病免疫进程中发挥主导作用,当ATB患者的CD+4细胞水平明显降低时,大大降低了对结核杆菌的杀伤力,使结核分枝杆菌得以增殖,使潜伏的结核病患者进入活动阶段。Logistic回归及决策树模型分析中均表明CD+4细胞为ATB的保护因素(OR < 1)。这与文献[17]报道结果一致。

    ATB影响因素的分析现如今大部分还停留在单因素分析上,然而单一指标用于预测疾病的能力有限,很难做出准确的判断[18]。本研究基于Logistic回归算法和决策树算法建立了ATB的风险预测模型,为ATB的早期诊断提供思路。经检验Logistic回归和决策树1的预测效果无统计学差异,虽然决策树1模型的准确度优于Logistic回归模型,但敏感度却低于Logistic回归模型。相较于决策树模型,当存在混杂变量的情况时,Logistic回归可准确反应自变量对因变量的作用,对于全局的掌控性更强,比决策树更能体现自变量与因变量的线性关系,并能通过OR值量化两个变量之间的效应[19]。决策树模型与Logistic回归模型相比,虽然对全局的控制较差,但它不受极端值的影响,也可以分析非线性和高度相关的数据[20]。此外决策树模型能形象的在树状图中将各危险因素呈现出来,以百分比的方式呈现各危险因素的特征,将不同特征的危险因素分开,便于医护人员识别高危人群[21]

    本研究为ATB危险因素的研究提供新的研究方向,Logistic回归模型与决策树模型在ATB危险因素评估方面都具有重要的应用价值,可互为补充。ATB影响因素众多,不同危险因素间会相互干扰,考虑到对Logistic的影响,本课题组将利用决策树模型的分析在各种检查中找出数据的局部结构,作为Logistic中构建因变量的依据。从不同层面分析ATB的危险因素及作用,同时将纳入潜伏性肺结核患者临床资料进行系统分析,从不同方向完善预测模型,为ATB的预防与控制提供有价值的参考。

  • 图  1  活动性肺结核影响因素决策树模型1

    Figure  1.  Decision tree model 1 of factors influencing ATB

    图  2  活动性肺结核影响因素决策树模型2

    Figure  2.  Decision tree model 2 of factors influencing ATB

    图  3  3组模型ROC曲线下面积比较

    Figure  3.  Comparison of the area under the ROC curve for the three model groups

    表  1  实验组与对照组单因素分析结果[n(%)/M(P25,P75)]

    Table  1.   Results of one-way analysis of variance between experimental and control groups [n(%)/M(P25,P75)]

    变量实验组(n = 200)对照组(n = 200)Z/χ2P
    性别
     男 113(56.5) 105(52.5) 0.645 0.422
     女 87(43.5) 95(47.5)
    年龄 51(33,64) 46(33,56) 3.156 0.076
    CRP 14.90(3.84,36.63) 1.30(0.70,2.70) 127.649 < 0.001**
    AGP 96.55(59.68,141.68) 56.05(43.70,68.38) 76.779 < 0.001**
    AAT 181.30(139.70,231.67) 133.05(114.55,151.00) 97.390 < 0.001**
    HAP 177.10(90.18,256.18) 95.50(62.60,142.73) 48.632 < 0.001**
    IgG 11.59(9.82,13.66) 11.18(9.84,13.14) 0.417 0.518
    IgM 0.97(0.69,1.33) 1.04(0.76,1.50) 3.830 0.050*
    IgA 1.89(1.24,2.66) 1.59(1.06,2.18) 10.184 0.001**
    CD+3 973.50(627.25,1277.50) 1239.59(976.67,1616.00) 43.275 < 0.001**
    CD+4 540.00(355.25,715.72) 750.47(563.75,897.52) 53.021 < 0.001**
    CD+8 371.52(230.25,555.96) 461.77(337.30,650.06) 19.923 < 0.001**
    CD+4/CD+8 1.49(1.03,1.99) 1.59(1.23,1.96) 2.657 0.103
    IL-1 3.20(1.60,7.22) 2.15(1.27,6.12) 11.009 < 0.001**
    IL-2 1.79(1.18,3.10) 1.43(0.99,2.21) 11.824 < 0.001**
    IL-4 1.37(0.96,1.88) 1.25(0.93,1.72) 3.920 0.048*
    IL-5 2.34(1.36,3.48) 1.46(0.93,2.36) 29.267 < 0.001**
    IL-6 9.18(3.31,26.41) 2.66(1.46,4.44) 104.701 < 0.001**
    IL-8 3.40(1.72,14.56) 3.66(1.44,11.32) 2.751 0.097
    IL-10 1.59(1.26,2.80) 1.51(0.97,2.52) 6.529 0.011*
    IL-12 1.64(1.25,2.26) 1.48(1.13,2.10) 2.584 0.108
    IL-17 2.15(1.34,6.44) 1.83(1.30,3.63) 4.385 0.036*
    IFN-γ 9.48(3.11,20.60) 3.19(1.80,6.34) 63.377 < 0.001**
    IFN-α 1.99(1.32,5.23) 2.00(1.26,3.91) 2.201 0.138
    TNF-α 1.98(1.39,3.87) 1.82(1.28,2.50) 8.049 0.005**
      *P < 0.05;**P < 0.01。
    下载: 导出CSV

    表  2  活动性肺结核影响因素的二元Logistics回归分析

    Table  2.   Binary Logistic regression analysis of factors influencing ATB

    项目βS.E.WaldPOR95%CI
    CRP 0.003 0.011 0.089 0.765 1.003 0.982~1.026
    AGP 0.005 0.006 0.699 0.403 1.005 0.994~1.016
    AAT 0.012 0.005 5.559 0.018* 1.012 1.002~1.023
    HAP 0.001 0.003 0.217 0.641 1.001 0.996~1.006
    IgA −0.018 0.081 0.051 0.821 0.982 0.838~1.105
    CD+3 0.002 0.002 1.822 0.177 1.002 0.999~1.006
    CD+4 −0.004 0.002 4.861 0.027* 0.996 0.992~1.000
    CD+8 −0.002 0.002 0.941 0.332 0.998 0.994~1.002
    IL-1 −0.055 0.028 3.816 0.051 0.947 0.896~1.000
    IL-2 0.134 0.082 2.677 0.102 1.143 0.974~1.342
    IL-4 0.314 0.133 5.571 0.018* 1.369 1.055~1.777
    IL-5 0.162 0.094 2.976 0.084 1.176 0.978~1.413
    IL-6 0.171 0.045 14.075 < 0.001** 1.186 1.085~1.296
    IL-10 −0.095 0.095 0.999 0.318 0.909 0.755~1.069
    IL-17 0.074 0.028 7.190 0.007** 1.077 1.020~1.136
    IFN-γ 0.034 0.017 3.909 0.048* 1.034 1.000~1.069
    TNF-α 0.033 0.092 0.128 0.721 1.033 0.863~1.237
    常量 −3.754 0.919 16.695 0.000 0.023
      *P < 0.05;**P < 0.01。
    下载: 导出CSV

    表  3  3组模型ROC曲线下面积

    Table  3.   the area under the ROC curve for the three groups of models

    模型AUC标准误P95%CI准确度(%)敏感度(%)特异度(%)约登指数
    Logistic0.8870.0174 < 0.001**0.852~0.91784.192.075.50.675
    决策树10.9000.0158 < 0.001**0.867~0.92885.282.583.50.660
    决策树20.8570.0185 < 0.001**0.819~0.89083.886.575.50.620
      **P < 0.01。
    下载: 导出CSV

    表  4  3组模型ROC曲线下面积比较结果

    Table  4.   Comparison of the results of the area under the ROC curve for the three groups of models

    组别曲线下面积差值标准误ZP95%CI
    Logistic VS 决策树10.0130.0200.6340.5260.026~0.052
    Logistic VS 决策树20.0300.0171.7740.0760.003~0.064
    决策树1 VS 决策树20.0430.0221.9330.049*0.001~0.084
      *P < 0.05。
    下载: 导出CSV
  • [1] Archer M C,McCollum J,Press C,et al. Stressed stability and protective efficacy of lead lyophilized formulations of ID93+GLA-SE tuberculosis vaccine[J]. Heliyon,2023,9(6):e17325. doi: 10.1016/j.heliyon.2023.e17325
    [2] 宋敏,陆普选,方伟军,等. 2022年WHO全球结核病报告: 全球与中国关键数据分析[J]. 新发传染病电子杂志,2023,8(1):87-92.
    [3] Li K,Liu S X,Yang C Y,et al. A routine blood test-associated predictive model and application for tuberculosis diagnosis: A retrospective cohort study from northwest China[J]. J Int Med Res,2019,47(7):2993-3007. doi: 10.1177/0300060519851673
    [4] Small P M,Pai M. Tuberculosis diagnosis-time for a game change[J]. N Engl J Med,2010,363(11):1070-1071. doi: 10.1056/NEJMe1008496
    [5] Pai M,Kalantri S,Dheda K. New tools and emerging technologies for the diagnosis of tuberculosis: Part II. Active tuberculosis and drug resistance[J]. Expert Rev Mol Diagn,2006,6(3):423-432. doi: 10.1586/14737159.6.3.423
    [6] 陈玉芊,王世军,王欣,等. IL-6、IL-8、IL-18、VEGF诊断活动性肺结核的价值[J]. 检验医学与临床,2023,20(2):224-227.
    [7] 汪永强,刘世军,李显勇,等. 外周血Th17/CD4+CD+25+CD127lowTreg细胞区分活动性肺结核和潜伏期结核合并肺炎[J]. 中国实验诊断学,2022,26(11):1648-1655.
    [8] 中华人民共和国国家卫生和计划生育委员会. 肺结核诊断标准(WS 288-2017)[J]. 新发传染病电子杂志,2018,3(1):59-61.
    [9] 邓国防,路希维. 肺结核活动性判断规范及临床应用专家共识[J]. 中国防痨杂志,2020,42(4):301-307.
    [10] 韩婷婷,刘桂珍,陈秋奇,等. 世界卫生组织《应对结核病及其共病合作行动框架》解读[J]. 中国防痨杂志,2023,45(1):25-30.
    [11] Feng Y,Wang J,Shao Z,et al. Predicting related factors of immunological response to hepatitis B vaccine in hemodialysis patients based on integration of decision tree classification and logistic regression[J]. Hum Vaccin Immunother,2021,17(9):3214-3220. doi: 10.1080/21645515.2021.1895603
    [12] 李良俊,翟荣,邬闻文,等. Logistic回归及决策树模型在CCU老年病人睡眠障碍影响因素分析中的应用[J]. 护理研究,2022,36(16):2874-2879.
    [13] 严建新,黄林瑶,江天. C-反应蛋白/白蛋白比值、单核细胞/淋巴细胞比值在肺结核患者中的应用价值[J]. 中国卫生检验杂志,2022,32(16):2016-2019.
    [14] Rohini K,Surekha Bhat M,Srikumar P S,et al. Assessment of hematological parameters in pulmonary tuberculosis patients[J]. Indian J Clin Biochem,2016,31(3):332-335. doi: 10.1007/s12291-015-0535-8
    [15] 宋丹,熊晓蕃,杨雨,等. 巨噬细胞极性重塑在疾病和组织稳态中的作用[J]. 中国细胞生物学学报,2022,44(5):904-923.
    [16] 龚文平,米洁,吴雪琼. 免疫活性物质: 结核病和非结核分枝杆菌病治疗的新选择[J]. 中国防痨杂志,2022,44(11):1107-1121.
    [17] Tesfa L,Koch F W,Pankow W,et al. Confirmation of Mycobacterium tuberculosis infection by flow cytometry after ex vivo incubation of peripheral blood T cells with an ESAT-6-derived peptide pool[J]. Cytometry B Clin Cytom,2004,60(1):47-53.
    [18] 卢艳辉,刘振奎,李世阳,等. 血清学指标联合小儿危重病例评分和Brighton儿童早期预警评分预测脓毒症患儿死亡的巢式病例对照研究[J]. 中国全科医学,2019,22(15):1800-1806.
    [19] 帅健,李丽萍,陈亚群,等. 决策树模型及Logistic回归模型在伤害发生影响因素分析中的作用[J]. 中华疾病控制杂志,2015,19(2):185-189.
    [20] 邬闻文,谭晓东,孙东晗,等. Logistic回归分析模型和决策树分析在高血压糖尿病共患病危险因素中的应用[J]. 中华疾病控制杂志,2022,26(7):827-833.
    [21] 李静,侯云霞,强万敏. 癌症患者非计划性再入院风险预测模型的范围综述[J]. 中华护理杂志,2022,57(9):1079-1087.
  • [1] 朱恩仙, 牛奔, 田丽娜, 谢亚娟.  2型糖尿病性周围神经病变合并微血管病变的危险因素分析, 昆明医科大学学报. doi: 10.12259/j.issn.2095-610X.S20240807
    [2] 黄友, 李国晖, 刘杜丽, 余孜孜, 左梅, 李芹, 吕波, 蔡乐.  云南墨江县农村汉族和哈尼族老年人高血压的流行现状及与心血管病危险因素聚集性的关系, 昆明医科大学学报. doi: 10.12259/j.issn.2095-610X.S20240907
    [3] 饶梅子, 蒋心怡, 缪佳蓉.  溃疡性结肠炎合并EB病毒和巨细胞病毒感染的危险因素分析, 昆明医科大学学报. doi: 10.12259/j.issn.2095-610X.S20241113
    [4] 徐文秀, 莫小凤, 杨祥民, 杨丝露, 吴凡, 李特.  Logistic回归与决策树模型在碘造影剂不良反应预测中的应用, 昆明医科大学学报. doi: 10.12259/j.issn.2095-610X.S20240911
    [5] 熊世锋, 邹浩.  胆囊癌淋巴结转移的危险因素分析, 昆明医科大学学报. doi: 10.12259/j.issn.2095-610X.S20220318
    [6] 周敏, 马智慧, 李加艳, 范建华, 林灵, 余亭颖, 张慧芳, 刘立.  肝硬化并胸水再发危险因素的预测, 昆明医科大学学报. doi: 10.12259/j.issn.2095-610X.S20220524
    [7] 王虹, 杨德兴, 王强, 周维钰, 唐杰夫, 王振方, 付凯, 刘圣哲, 刘荣.  ICU脓毒症患者发生再喂养综合征的危险因素分析及预测模型建立, 昆明医科大学学报. doi: 10.12259/j.issn.2095-610X.S20221102
    [8] 张桂梅, 陈蜀, 宋云华, 吴阳, 周虹媛.  AECOPD患者再入院危险因素分析及预测模型的构建, 昆明医科大学学报. doi: 10.12259/j.issn.2095-610X.S20220830
    [9] 沈凌筠, 王霖, 马志强, 刘幸, 李海雯, 王戈, 李文明, 骆鹏举.  活动性与非活动性肺结核患者的免疫特点, 昆明医科大学学报. doi: 10.12259/j.issn.2095-610X.S20220821
    [10] 樊浩, 刘幸, 沈凌筠, 李海雯, 余春红, 李婧炜.  基于AAT与细胞因子构建活动性肺结核的Nomogram预测模型, 昆明医科大学学报. doi: 10.12259/j.issn.2095-610X.S20220816
    [11] 王静, 唐莲芳, 顾美群, 许小艳, 余建华, 何山, 李紫薇, 毕凯, 刘丽巧, 赵琼, 米弘瑛.  新生儿坏死性小肠结肠炎的危险因素及早期临床特点, 昆明医科大学学报. doi: 10.12259/j.issn.2095-610X.S20211118
    [12] 孟泽祖, 鲜航, 侯晓进, 魏石磊, 马继, 赵睿, 丛锐.  断指再植术后血管危象相关危险因素, 昆明医科大学学报. doi: 10.12259/j.issn.2095-610X.S20210122
    [13] 李军.  昆明市出租车司机疲劳与相关健康和安全危险因素, 昆明医科大学学报.
    [14] 戴梅.  昆明市儿童哮喘的危险因素分析, 昆明医科大学学报.
    [15] 李芫苑.  云南宾川一起肝片吸虫病暴发的危险因素调查, 昆明医科大学学报.
    [16] 杨泽星.  人工流产等因素与输卵管性不孕关系的临床研究, 昆明医科大学学报.
    [17] 刘漪.  呼吸重症监护病房多重耐药鲍曼不动杆菌感染危险因素回顾性分析, 昆明医科大学学报.
    [18] 杨茂林.  后腹腔镜根治性肾切除与肾部分切除中转开放的危险因素分析, 昆明医科大学学报.
    [19] 张学玉.  昆明市官渡区心血管疾病患病与危险因素聚集性的关系调查分析, 昆明医科大学学报.
    [20] 杨秋萍.  心血管危险因素聚集与心率变异性的关系研究, 昆明医科大学学报.
  • 期刊类型引用(1)

    1. 明锦翼,蔡志丹,卢仪杰,李育达,史秉弘. 基于机器学习和遗传算法的智能补货决策模型. 现代计算机. 2024(15): 38-42 . 百度学术

    其他类型引用(1)

  • 加载中
图(3) / 表(4)
计量
  • 文章访问数:  1867
  • HTML全文浏览量:  1116
  • PDF下载量:  22
  • 被引次数: 2
出版历程
  • 收稿日期:  2023-05-17
  • 网络出版日期:  2023-09-21
  • 刊出日期:  2023-09-30

目录

/

返回文章
返回