近日,北京中日友好医院呼吸与危重症医学科杨萌主任团队,上海市肺科医院张鹏教授团队,华西医院王业教授、王凯歌博士团队与9159金沙登录入口合作,在《Journal of Translational Medicine》(IF 6.1)发表了一篇关于肺结节良恶性鉴别的研究论文,题为《Enhancing the differential diagnosis of small pulmonary nodules: A comprehensive model integrating plasma methylation, protein biomarkers and LDCT imaging features》 [1]。该研究综合分析了血液游离DNA(cfDNA)甲基化、血浆蛋白质标志物和低剂量螺旋CT(LDCT)影像特征,结合人工智能算法,为肺结节,尤其是小结节的良恶性鉴别提供了全新的方法。
肺癌是“全球第一大癌症”,也是“全球第一大癌症杀手”[2]。尽管LDCT被证明能够有效检测早期肺癌,但仅使用LDCT区分恶性和良性结节依然具有挑战性 [3]。目前,基于传统影像学和生物标志物的研究,由于临床数据的复杂性,在实际应用中存在一定的局限性。因此,本研究通过整合cfDNA甲基化模式、蛋白质标志物和LDCT影像特征,开发了一种高精度的深度学习模型,旨在为肺癌的早期筛查提供新的策略。
「研究亮点」
多组学数据融合提升诊断准确性:研究创新性地将cfDNA甲基化、蛋白质标志物和LDCT影像特征相结合,通过多维度数据的融合,有效提高了肺结节良恶性鉴别的准确性,尤其对小于10毫米的小结节有显著提升。
AI算法助力精确分类:开发了以深度学习为核心的算法流程,能够高效提取并融合多组学特征,为临床提供了强有力的辅助诊断工具。
「研究方法」
该研究共纳入了419名肺结节患者样本,分为训练集(324例)和测试集(95例)。所有恶性结节均为0至I期的早期样本。研究流程(图1)和分析方法如下:
图1 研究流程
cfDNA甲基化分析:通过9159金沙登录入口的mTitan技术对1656个标志物进行靶向高通量甲基化测序,并计算cfDNA甲基化特征评分(MMS),该评分可能揭示肿瘤的早期信号。该流程的核心是在片段序列层面,采用基于多头注意力机制的Transformer模型,以充分利用甲基化序列信息。
图2 深度学习为基础的甲基化特征提取流程
蛋白质标志物检测:研究采用Olink Proximity Extension Assay(PEA)技术,检测血浆中潜在与肺癌相关的366种蛋白质丰度,为模型提供额外的信号特征,从而进一步提升分类的准确性。
LDCT影像特征提取:研究使用LDCT图像数据,由两位经验丰富的放射科医生手动标记肺结节区域,并提取1316个影像组学特征,以反映结节的大小、纹理和形态等特征(图3)。
图3 LDCT影像特征提取流程
模型构建与评估:研究首先分别构建了甲基化、蛋白质和影像三个基础神经网络模型,以三个基础模型预测得分为特征,构建最终逻辑回归分类器。模型均采用5折交叉验证方式进行训练,并在测试集中进行验证。
「研究结果」
1,甲基化、蛋白质和影像基础模型均能有效鉴定肺结节良恶性
使用1646个MMS特征训练的甲基化模型在测试集中,区分良恶性结节的AUC达到0.799(图4A),敏感性、特异性分别是77.6%,60.9%。使用366个蛋白训练的模型在测试集中AUC、灵敏度和特异性分别是0.846(图4B)、83.7%和73.9%。而基于影像特征训练的模型AUC为0.866(图4C),稍高于甲基化和蛋白质模型, 灵敏度特异性分别是71.4%,82.6%。
结合甲基化和蛋白质模型打分,训练的逻辑回归模型在测试集中AUC达到0.904(图4D),显著高于甲基化(P = 0.01)和蛋白质(P = 0.03)模型。甲基化和影像整合模型,以及蛋白质和影像整合模型在测试集中AUC分别达到0.903(图4E),0.902(图4F)。这些结果表明甲基化、蛋白质以及影像特征在鉴别肺结节良恶性中起到了很好的互补效应。
图4 基础模型和两两结合模型性能评估
2,甲基化、蛋白质以及影像融合提升模型性能,在小结节中表现优异
将甲基化、蛋白质和影像评分构建的融合模型在测试集中表现优异,AUC达到0.925(图5A),灵敏度特异性分别是83.7%、82.6%,相对于三个基础模型均有提升。在5-10毫米的小结节中,融合模型表现出更好的检测性能,AUC达到0.951(图5B)。研究团队为评估模型潜在临床应用价值,采用了决策曲线分析(DCA)来辅助临床决策。DCA通过权衡不同阈值下真阳性的益处和假阳性的危害,根据对应净效益来评价模型效果。当模型的净效益在较宽范围内持续超过极端曲线时,表明模型在相对安全的阈值范围内具有较高的选择性。与治疗所有患者的策略相比,模型在测试集中阈值概率超过0.07时均显示出更高的净受益(图6),说明模型可在不同场景下选择合适的阈值以应对临床需求。
图5 最终融合模型效果评估
图6 测试集中不同模型净收益曲线
「总结」
该研究展示了多组学融合技术的强大潜力,为肺结节特别是肺小结节的诊断提供了一个新的思路。结合分子特征和影像特征的模型有助于更好地评估肺结节的恶性风险,优化肺癌早期筛查流程。
「参考文献」
[1] Yang M, Yu H, Feng H, Duan J, Wang K, Tong B, Zhang Y, Li W, Wang Y, Liang C et al: Enhancing the differential diagnosis of small pulmonary nodules: a comprehensive model integrating plasma methylation, protein biomarkers, and LDCT imaging features. J Transl Med 2024, 22(1):984.
[2] Bray F, Laversanne M, Sung H, Ferlay J, Siegel RL, Soerjomataram I, Jemal A: Global cancer statistics 2022: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries. CA Cancer J Clin 2024, 74(3):229-263.
[3] de Koning HJ, van der Aalst CM, de Jong PA, Scholten ET, Nackaerts K, Heuvelmans MA, Lammers JJ, Weenink C, Yousaf-Khan U, Horeweg N et al: Reduced Lung-Cancer Mortality with Volume CT Screening in a Randomized Trial. N Engl J Med 2020, 382(6):503-513.
声明:*本文仅供医学专业人士阅读参考。医学界力求其发表内容专业、可靠,但不对内容的准确性做出承诺;请相关各方在采用或以此作为决策依据时另行核查。