A Two-sample Mendelian Randomization Study of Oily Nut Intake and Primary Lung Cancer
-
摘要:
目的 以两样本孟德尔随机化方法探讨油性坚果摄取量与原发性肺癌的因果关系。 方法 从全基因组关联研究openGWAS公开数据库中筛选出与油性坚果摄入量相关的(P < 5×10-7)单核苷酸多态性位点作为工具变量,以逆方差加权法为该研究评估因果效应的主要分析方法,并采用MR-Egger回归和加权中位数法用于补充说明,以OR值及95%CI评价油性坚果摄入量与原发性肺癌之间是否存在因果关系。采用mr_pleiotropy_test法及MR-PRESSO法检验水平多效性,leave-one-out留一法进行敏感性检验。 结果 从ukb-b-16576数据集共提取100个SNP作为工具变量,MR-Egger回归、加权中位数和逆方差加权法计算得OR值和95%可信区间分别[0.63,95%CI(0.11~3.65),P = 0.611],[0.34,95%CI(0.19~0.61),P = 0.001],[0.32,95%CI(0.21~0.48),P = 0.001)],所有b值结果方向均小于0。mr_pleiotropy_test检验显示MR-Egger截距为-7.66E-03,接近于0,P = 0.441,同样MR-PRESSO包GlobalTest检验P = 0.162,所选的工具变量不存在水平多效性,经过leave-one-out敏感性分析,未发现任何SNP位点对结果产生显著影响,表明结果具有较高的稳定性和可靠性。 结论 两样本孟德尔随机化分析表明油性坚果摄入量与原发性肺癌的发病风险呈负向因果关系,但需要更大样本量和不同种族背景的人的数据来进一步验证。 Abstract:Objective To investigate the potential causal relationship between oily nut consumption and primary lung cancer by two-sample Mendelian randomization method. Methods Single nucleotide polymorp hisms (P < 5×10-7) associated with oily nut intake were screened from the openGWAS public database of genome - wide association study as instrumental variables. The inverse variance weighting method was the main analysis method to evaluate the causal effect of this study, and MR-Egger regression and weighted median method were used to supplement the explanation. OR value and 95%CI were used to evaluate whether there was a causal relationship between oily nut intake and primary lung cancer. The mr_pleiotropy_test and MR-PRESSO were used to test the level pleiotropy, and the leave-one-out method was used to test the sensitivity. Results A total of 100 SNPs were extracted from the ukb-b-16576 dataset as instrumental variables. The MR-Egger regression, weighted median, and inverse variance weighting methods yielded OR values and 95% confidence intervals [0.63, 95%CI (0.11-3.65), P = 0.611], [0.34, 95%CI (0.19-0.61), P = 0.001], [0.32, 95%CI (0.21-0.48), P = 0.001], rerespectively. The mr_pleiotropy_test showed that the MR-Egger intercept was close to 0 (-7.66E-03) with a p-value of 0.441, indicating no significant horizontal pleiotropy. Similarly, the MR-PRESSO package GlobalTest yielded a p-value of 0.162, further confirming the absence of horizontal pleiotropy among the selected instrumental variables.After conducting the leave-one-out sensitivity analysis, no significant influence on the results was observed from any specific SNP locus, indicating that the results are highly stable and reliable. Conclusions The two-sample Mendelian randomization analysis revealed a negative causal relationship between oily nut intake and the risk of primary lung cancer. However, further verification is needed with larger sample sizes and data from individuals of different ethnic backgrounds to strengthen the findings. -
Key words:
- Oily nuts /
- Primary lung cancer /
- Mendel randomization /
- Causal inference
-
原发性肺癌(primary pulmonary carcinoma)是一种常见且具有极大危害性的恶性肿瘤。根据全球癌症流行病学统计数据显示,2020年全球新发220.7万肺癌病例,新增179.6万死亡肺癌病例,分别占全部恶性肿瘤新发和死亡病例的11.4%和18.0%[1],而在中国2022年新发肺癌病例约87.1万,新增肺癌死亡病例约76.7万,分别占所有恶性肿瘤发病和死亡病例的18.1%和23.9%,肺癌新增和死亡病例均位居我国恶性肿瘤的首位[2]。研究测算了预计在2020~2050年间,癌症将使世界损失25.2万亿美元,其中肺癌的经济负担最重,将造成全球3.9万亿美元的损失,通过预防肺癌发生对减轻社会经济负担意义重大[3]。坚果,即果实成熟后为干燥状态的果子,例如板栗、榛子、腰果、瓜子、松仁、杏仁、白果、开心果、夏威夷果等,其对增强体质、预防疾病有极好的功效[4]。 1项基于人群的肺癌病因学病例对照研究以及美国国立卫生研究院有关饮食与健康研究的前瞻性队列研究均显示,油性坚果(核桃、榛子、杏仁和花生)的消费量与肺癌发病率呈负相关,吸烟人群从坚果消费中获益更为明显[5],同样荷兰1项对120852名老年人进行20.3 a的随访研究显示增加坚果摄入量可能有助于预防男性小细胞肺癌[6]。因上述研究属于观察性队列研究,由于观察法更易受制于暴露与结局之外的混调变量干扰,故该方法难以深刻揭示暴露与结局之间的因果效应,无法明确摄入坚果能否降低原发性肺癌发病率。因此,本研究采用两样本MR法计算油性坚果摄入量与原发性肺癌之间的因果效应值大小,评价两者是否存在因果关系,为肺癌防治提供理论参考依据。
1. 资料与方法
1.1 数据来源
通过IEU openGWAS数据库(http://www.mrbase.org)[7]获取近年来样本量较大原发性肺癌及坚果摄入量的GWAS数据,2组数据均为欧洲人群,其中坚果摄入量数据集ukb-b-16576样本数为421764例,共9851867个SNP位点。原发性肺癌数据ieu-a-966的总样本量为27209,包含11348例患者及15861例对照人群,894589个SNP位点。
1.2 工具变量筛选
通过R语言TwoSampleMR包[8] extract instruments函数获取工具变量,设置p1参数为参数为5×10-7,clumpTRUE去掉连锁不平衡LDA的工具变量,设置KB和r2参数分别为1000和0.001,去掉在1Mb范围内与最显著SNP的r2大于0.001的SNP,然后与结局变量原发性肺癌的SNP汇总取交集,构建SNPs-暴露因素-结局因素关系,删除经phenoscanner函数检索出的的与支气管哮喘[9]、慢性阻塞性肺疾病[10]相关位点以及与原发性肺癌直接相关的SNP位点。采用弱工具变量可能引起相应偏倚,因此通过计算F值评估工具变量与暴露因素的关联强度计算公式为:F=[R2×(N-1-K)]/[K×(1-R2)],R2=MAF×(1-MAF)×β/SD,式中N为暴露的样本量;K为纳入的 SNP 个数;R2为筛选SNP 所解释的变异比例;β为油性坚果摄入量相关SNP的效应值;MAF为最小等位基因频率[11]。F值<10 提示可能存在弱工具变量偏倚,值越大表示工具变量是弱工具变量的可能性越小。
1.3 因果效应估计
MR-Egger回归、加权中位数及逆方差加权法检验油性坚果摄入量与原发性肺癌之间的因果关联。由于两样本随机化的暴露和结局分别来自于不同的样本,可能存在人群不同等异质性,因此需要通过Cochrans Q异质性检验说明,若P < 0.05说明存在异质性。
1.4 可靠性评价
水平多效性是指当暴露因素为0时,工具变量对结局仍有效应,即通过混杂因素起作用,如果水平多效性检验显著,说明工具变量不仅与暴露相关,同时还与其他混杂因素相关。采用MR-Egger回归的截距项是否接近于0时检验水平多效性,当截距接近0时可认为符合排他性假设代表工具变量不存在水平多效性,反之则表示可能存在基因多效性。另外利用R包MR-PRESSO的global test函数也可检测水平多效性是否存在,该函数计算去除该每一个SNP后的IVW结果,然后再计算该SNP的效应与IVW结果的残差平方和,即该SNP到去掉该SNP计算出的拟合线的距离。最后将每个SNP计算出来的残差平方和(SSE)累加,该值越大,说明水平多效性越显著[12]。运用Leave-one-out方法进行敏感性检验,循环逐个剔除单个SNP,以剩余的 SNPs 作为工具变量进行两样本MR分析,分析某个SNP是否对结果造成显著性改变[13]。本研究使用R4.1.0 (http://www.R-project.org)软件完成,采用双侧检验,检验水准α= 0.05。
2. 结 果
2.1 工具变量信息
经过首次筛选,ukb-b-16576数据集共得到100个SNP位点,因支气管哮喘及慢性阻塞性肺疾病增加原发性肺癌风险,属于混杂因素,故删除其中与支气管哮喘、慢性阻塞性肺疾病混杂因素相关的rs6533184、rs2071627、rs437955、rs3095340、rs7808471共5个位点,经过与原发性肺癌数据集匹配后最终纳入91个工具变量,SNP位点F值分布范围25.32~81.23之间,中位数34.03,累计R 2 = 0.161,表明不存在弱工具变量,具体信息见表1。
表 1 工具变量SNP信息表Table 1. Instrumental variable SNP information tableSNP chr EA OA EAF B S R2 F P rs3101339 1 C A 0.6 1.43E−02 1.71E−03 3.36E−03 69.91 6.20E−17 rs10740991 10 C G 0.72 1.67E−02 1.86E−03 3.35E−03 81.23 2.00E−19 rs746868 6 G C 0.61 −1.29E−02 1.71E−03 3.03E−03 56.65 5.20E−14 rs4269101 3 G T 0.72 −1.38E−02 1.86E−03 2.75E−03 55.17 1.10E−13 rs9385269 6 T C 0.52 1.21E−02 1.68E−03 2.65E−03 51.48 7.20E−13 rs4800488 18 A C 0.49 1.20E−02 1.67E−03 2.49E−03 51.36 7.70E−13 rs4149513 2 A G 0.49 1.17E−02 1.67E−03 2.46E−03 49.25 2.20E−12 rs1582322 16 G A 0.6 9.94E−03 1.72E−03 2.32E−03 33.58 6.80E−09 。。。。。。。。。。。。。。。。。。。。。。。。。 。。。。。。。。。。。。。。。。。。。。。。。。。 rs7829800 8 G A 0.67 −1.04E−02 1.79E−03 2.30E−03 34.16 5.10E−09 rs261809 1 G A 0.54 −9.63E−03 1.68E−03 2.17E−03 32.88 9.80E−09 rs6533183 4 T C 0.66 −9.54E−03 1.76E−03 2.16E−03 29.42 5.80E−08 rs4140799 14 A G 0.53 9.46E−03 1.68E−03 2.11E−03 31.74 1.80E−08 rs10087278 8 A G 0.59 8.99E−03 1.70E−03 2.11E−03 27.92 1.30E−07 rs10129747 14 G A 0.53 9.36E−03 1.68E−03 2.07E−03 30.98 2.60E−08 rs3757323 6 C T 0.63 8.90E−03 1.74E−03 2.06E−03 26.28 2.90E−07 rs11073575 15 C T 0.58 −8.90E−03 1.70E−03 2.05E−03 27.28 1.80E−07 2.2 两样本孟德尔随机化结果
根据本次研究的结果,使用随机效应逆方差加权法计算的坚果摄入量与原发性肺癌之间的OR值和95%CI为0.32 (95%CI 0.21~0.48),表明原发性肺癌的发病风险随着坚果摄入量每增加一个SD而降低68%,见表2及图1。类似MR-EggER回归、加权中位数法结果分别为0.63(95%CI 0.11~3.65),0.34(95%CI 0.19~0.61),CochanceQ检验结果均显示P > 0.05,表明工具变量间不存在异质性,见图2,故主要采用IVW法固定效应模型分析结果,IVW法计算的结果显示P < 0.05,其它4方法的效应b值方向与IVW的b值方向相同,结果存在统计学意义(P < 0.05),可以认为坚果摄入量是原发性肺癌的保护性因素,见图3。
表 2 5种MR分析方法OR估计值及95%CITable 2. OR estimates and 95% CI of five MR analysis methodsmethod b se P OR 95%CI Q值 Q_pval MR Egger −0 .47 0.89 0.611 0.63(0.11,3.65) 99.32 0.15 Weighted median −1.07 0.29 0.001 0.34(0.19,0.61) 100.01 0.16 Inverse variance weighted −1.14 0.21 0.001 0.32(0.21,0.48) Simple mode −0.99 0.76 0.192 0.37(0.08,1.64) Weighted mode −0.99 0.73 0.173 0.37(0.08,1.51) 2.3 可靠性分析结果
MR-Egger回归的截距项Intercep为-7.66E-03,接近于0,标准误为0.001,P = 0.441,见图3。MR-PRESSO包global test检验P = 0.161,同样表明油性坚果摄入量对原发性肺癌的因果效应分析结果受基因水平多效性影响的可能性较小。利用留一法对IVW法的结果进行敏感性分析发现,当逐个移除每个SNP位点时,剩余的90个SNP与IVW法合并的OR效应值接近,且黑点连线流畅,没有发现显著的异常偏倚位点,代表之前由IVW法得出的效应OR值相对稳健,见图4。综合而言,这一敏感性分析表明IVW法的结果相对可靠。
3. 讨论
3.1 主要创新点
本研究以大样本的GWAS汇总数据为基础,应用两样本孟德尔随机化方法探究油性坚果(核桃、榛子、杏仁和花生)摄入量与原发性肺癌发病风险之间的因果关系,结果表明油性坚果摄入量与原发性肺癌发病风险之间存在显著负向因果关系,随着油性坚果摄入量每增加一个标准差原发性肺癌的发病风险下降0.68倍,可以认为坚果摄入量是原发性肺癌的保护因素。
3.2 坚果的营养成分及防癌机理
坚果是一种营养丰富的食物,主要含有碳水化合物、蛋白质和脂肪。此外,还富含多种维生素(如维生素B和维生素E)、微量元素(如磷、钙、锌和铁)以及多酚类化合物,特别值得一提的是油性坚果所含的脂肪酸以不饱和脂肪酸为主,如亚麻酸和亚油酸等,这些脂肪酸是人体必需的[14],坚果的丰富营养成分使其成为一种健康的食物选择。动物研究表明多不饱和脂肪酸(polyunsaturated fatty acids,PUFA)具有抗肿瘤和抗炎特性,1项对121970名研究参与者有关膳食PUFA摄入量与肺癌风险之间的前瞻性队列研究发现总PUFA以及n-6 PUFAs和n-3 PUFA之间的比率与肺癌风险呈负相关[15],特别是对于鳞癌和小细胞肺癌[16]。锌为DNA结合蛋白的重要组成部分,如参与DNA修复的铜/锌超氧化物歧化酶,锌在转录因子功能、抗氧化防御和DNA修复中起着重要作用,饮食中锌的缺乏会引起自由基应激反应,导致单链和双链DNA断裂,损伤DNA,从而增加癌症发展的风险,而核桃、葵花子、松子、腰果、杏仁以增加锌的人体含量,血锌通过减慢端粒损耗和调节癌症相关基因的表达可预防肺癌[17]。多酚被认为具有防癌和抗癌的作用,其机理主要涉及防突变、抗氧化、免疫调节、抑制肿瘤细胞增殖、诱导癌细胞凋亡、抑制致癌基因的表达以及调控肿瘤细胞信号转导等方面。部分坚果富含多酚类物质,如儿茶素、黄酮类、花青素,儿茶素可通过抗氧化、抑制肿瘤新生血管生成、阻滞肿瘤细胞分裂周期、诱导癌细胞凋亡及调控microRNA等方面多途径、多靶点地发挥防癌抑癌作用[18]。黄酮类通过靶向蛋白激酶C (protein kinase C,PKCs)干扰受体酪氨酸激酶级联反应(recepter tyrosine kinase,RTKs)的激活,参与调控细胞分化、增殖、存活、迁移,抑制肿瘤发生[19]。
3.3 孟德尔随机化及本研究的局限性
孟德尔随机化是基于全基因组关联分析数据,以单核苷酸多态性SNP作为天然的工具变量,用以推断因果关系的新型流行病学方法,相较于队列研究等观察性研究,暴露在受精时便已确定,不易受到混杂因素及反向因果的干扰,因而能够有效减少偏倚。本研究筛选出与坚果摄入量紧密关联的SNP作为工具变量,在满足三大假设的前提下运用MR模拟伪随机化试验分析坚果摄入量与原发性肺癌的因果关系,排除模型内生性问题,得到的模型参数为一致性估计,结论更加可靠[20]。但本研究存在相对不足之处,因GWAS数据库主要为欧洲血统,缺乏其他人种数据,结论外推性可能不佳,其次MR分析运用的2阶段最小二乘法本质上仍属于线性模型,无法拟合非线性关系[21],而真实世界中变量关系往往为非线性,另外因无个体属性数据,MR分析只能得到平均因果效应,无法进行亚组分析,更难以推断个体因果效应。
本研究为接下来的研究供了流行病学调查基础,油性坚果摄入量与原发性肺癌的因果关联有待于大样本随机对照试验及不同种族背景人群数据来进一步证实。此外,未来的研究还需继续探究坚果预防原发性肺癌的作用机制,需要强调的是,油性坚果最佳用量尚不明确,也是未来研究的重要着眼点。简而言之,本研究采用两样本孟德尔随机化方法对油性坚果摄入量和原发性肺癌之间的因果关系进行初步探究,结果表明增加油性坚果摄入量可能降低原发性肺癌的罹患率,值得宣传及推广。
-
表 1 工具变量SNP信息表
Table 1. Instrumental variable SNP information table
SNP chr EA OA EAF B S R2 F P rs3101339 1 C A 0.6 1.43E−02 1.71E−03 3.36E−03 69.91 6.20E−17 rs10740991 10 C G 0.72 1.67E−02 1.86E−03 3.35E−03 81.23 2.00E−19 rs746868 6 G C 0.61 −1.29E−02 1.71E−03 3.03E−03 56.65 5.20E−14 rs4269101 3 G T 0.72 −1.38E−02 1.86E−03 2.75E−03 55.17 1.10E−13 rs9385269 6 T C 0.52 1.21E−02 1.68E−03 2.65E−03 51.48 7.20E−13 rs4800488 18 A C 0.49 1.20E−02 1.67E−03 2.49E−03 51.36 7.70E−13 rs4149513 2 A G 0.49 1.17E−02 1.67E−03 2.46E−03 49.25 2.20E−12 rs1582322 16 G A 0.6 9.94E−03 1.72E−03 2.32E−03 33.58 6.80E−09 。。。。。。。。。。。。。。。。。。。。。。。。。 。。。。。。。。。。。。。。。。。。。。。。。。。 rs7829800 8 G A 0.67 −1.04E−02 1.79E−03 2.30E−03 34.16 5.10E−09 rs261809 1 G A 0.54 −9.63E−03 1.68E−03 2.17E−03 32.88 9.80E−09 rs6533183 4 T C 0.66 −9.54E−03 1.76E−03 2.16E−03 29.42 5.80E−08 rs4140799 14 A G 0.53 9.46E−03 1.68E−03 2.11E−03 31.74 1.80E−08 rs10087278 8 A G 0.59 8.99E−03 1.70E−03 2.11E−03 27.92 1.30E−07 rs10129747 14 G A 0.53 9.36E−03 1.68E−03 2.07E−03 30.98 2.60E−08 rs3757323 6 C T 0.63 8.90E−03 1.74E−03 2.06E−03 26.28 2.90E−07 rs11073575 15 C T 0.58 −8.90E−03 1.70E−03 2.05E−03 27.28 1.80E−07 表 2 5种MR分析方法OR估计值及95%CI
Table 2. OR estimates and 95% CI of five MR analysis methods
method b se P OR 95%CI Q值 Q_pval MR Egger −0 .47 0.89 0.611 0.63(0.11,3.65) 99.32 0.15 Weighted median −1.07 0.29 0.001 0.34(0.19,0.61) 100.01 0.16 Inverse variance weighted −1.14 0.21 0.001 0.32(0.21,0.48) Simple mode −0.99 0.76 0.192 0.37(0.08,1.64) Weighted mode −0.99 0.73 0.173 0.37(0.08,1.51) -
[1] Sung H,Ferlay J,Siegel R L,et al. Global cancer statistics 2020: Globocan estimates of incidence and mortality worldwide for 36 cancers in 185 countries[J]. CA Cancer J Clin,2021,71(3):209-249. doi: 10.3322/caac.21660 [2] Xia C,Dong X,Li H,et al. Cancer statistics in China and United States,2022: Profiles,trends,anddeterminants[J]. Chin Med J (Engl),2022,135(5):584-590. doi: 10.1097/CM9.0000000000002108 [3] Chen S,Cao Z,Prettner K,et al. Estimates and projections of the global economic cost of 29 cancers in 204 countries and territories from 2020 to 2050[J]. JAMA Oncol,2023,9(4):465-472. doi: 10.1001/jamaoncol.2022.7826 [4] 开比努尔·再比布力,姑丽切克然·艾斯克,韩加. 坚果营养成分及保健功效的研究[J]. 粮食与食品工业,2022,29(3):32-36. doi: 10.3969/j.issn.1672-5026.2022.03.009 [5] Chang C,Xinyan G,Yan H,et al. Association between nut consumption and cancer risk: A meta-analysis[J]. Nutrition and cancer,2022,75(1):11-13. [6] Nieuwenhuis L,van den Brandt P A. Nut and peanut butter consumption and the risk of lung cancer and its subtypes: A prospective cohort study[J]. Lung Cancer,2019,128(1):57-66. [7] Hemani G,Zheng J,Elsworth B,et al. The MR-Base platform supports systematic causal inferenceacross the human phenome[J]. Elife,2018,7(1):e34408. [8] Rasooly D,Patel C J. Conducting a reproducible mendelian randomization analysis using the R analytic statistical environment.[J]. Current Protocols in Human Genetics,2019,101(1):82. doi: 10.1002/cphg.82 [9] Paraskevas A,Bellou E ,Keramida E,et al. Bronchial asthma and lung cancer[J]. Current Respira tory Medicine Reviews,2021,17(2): 78-82. [10] Forder A,Zhuang R,Souza V,et al. Mechanisms contributing to the comorbidity of COPD and lung cancer[J]. Int J Mol Sci,2023,24(3):2859-2861. doi: 10.3390/ijms24032859 [11] Levin M G, Judy R, Gill D, et al. Genetics of height and risk of atrial fibrillation: A Mendelian randomization study[J]. PLoS Med,2020,17(10):e1003288. [12] Fu R,Kim S J. Inferring causality from observational studies: the role of instrumental variable ana lysis[J]. Kidney Int,2021,99(6):1303-1308. doi: 10.1016/j.kint.2021.03.018 [13] Wang X,Jiang Y,Zhang N R,et al. Sensitivity analysis and power for instrumental variable studi es[J]. Biometrics,2018,74(4):1150-1160. doi: 10.1111/biom.12873 [14] 周启武,唐兴莹,李志宏,等. 5种市售坚果类产品部分营养成分及重金属元素分析[J]. 安徽农业科学,2022,50(19):193-197. [15] Luu H N,Cai H,Murff H J,et al. A prospective study of dietary polyunsaturated fatty acids int ke and lung cancer risk[J]. Int J Cancer,2018,143(9):2225-2237. doi: 10.1002/ijc.31608 [16] Yang J J,Yu D,Takata Y,et al. Dietary Fat intake and lung cancer risk: A pooled analysis[J]. J Clin Oncol,2017,35(26):3055-3064. doi: 10.1200/JCO.2017.73.3329 [17] Bai Y,Wang G,Fu W,et al. Circulating essential metals and lung cancer: risk assessment and p tential molecular effects[J]. Environ Int,2019,127(6):685-693. doi: 10.1016/j.envint.2019.04.021 [18] 李晓阳,吴志平,王梦馨,等. 表没食子儿茶素没食子酸酯抗癌分子机制及其应用的研究进展[J]. 草药,2019,50(13):3217-3229. [19] Zanoaga O,Braicu C,Jurj A,et al. Progress in research on the role of flavonoids in lung can cer[J]. Int J Mol Sci,2019,20(17):4291-4293. doi: 10.3390/ijms20174291 [20] Baer Benjamin R,Strawderman Robert L,Ertefaie Ashkan,et al. Discussion on Instrumental variable estimation of the causal hazard ratio[J]. Biometrics,2023,79(2):554-558. [21] Fei W,Dylan S,Nandita M. A general approach to evaluating the bias of 2-stage instrumental var iable estimators[J]. Statistics in Medicine,2018,37(12):1997-2015. doi: 10.1002/sim.7636 期刊类型引用(1)
1. 王友炼,吴涛,白遵光,袁少英. 有糖尿病史的前列腺脓肿患者住院治疗期间发生上消化道出血1例报告. 现代泌尿外科杂志. 2020(02): 194-195 . 百度学术
其他类型引用(0)
-