宋玉琴教授:AI赋能,数据驱动——构建临床科研智能新范式 | 2025 CSCO

发布时间:2025-09-17 19:36  浏览量:3

*仅供医学专业人士阅读参考

告别文献瀚海,AI秒速循证;解锁医保数据,发现真实世界。

撰文 | Jeffry

在2025年中国临床肿瘤学会(CSCO)年会上,一场题为《数据驱动的临床研究新范式:医保数据挖掘和临床实践循证》的专题报告成为了会议的一大亮点。报告人北京大学肿瘤医院宋玉琴教授,深入剖析了当前临床研究面临的挑战与机遇,系统性地阐述了如何利用医保大数据和人工智能技术,构建一种更高效、更贴近真实世界、更能回答复杂临床问题的研究新范式。

这场报告不仅为与会者提供了全新的方法论视角,也指明了未来临床研究从“经典试验驱动”向“真实数据驱动”转型的清晰路径,引发了肿瘤学界乃至整个医学界对于未来科研模式的深刻思考。

图1. 宋玉琴教授大会报告

医保数据挖掘:解锁真实世界研究的“宝藏”

随机对照试验(RCT)的局限性在当今复杂的医疗环境中日益凸显。其严苛的入排标准导致了研究人群的高度选择性,使得结果难以外推至真实世界中年龄更大、合并症更多、依从性各异的广大患者群体。同时,RCT漫长的研究周期和高昂的经济成本,也使其在许多紧迫的临床问题上显得缓不济急。

正是在这样的背景下,医保数据的价值被重新发现和评估。宋玉琴教授将其誉为一座亟待挖掘的“新宝藏”。医保数据完整记录了参保人员全流程的医疗信息,包括诊断、用药、检查、检验、手术及费用等,具有四大独特优势:其一,数据规模巨大,覆盖数千万乃至上亿人口,为研究提供了强大的统计效力;其二,更新及时,通常延迟仅T+3个月,能快速反映临床实践的最新变化;其三,代表性强,源于最广泛的真实诊疗场景,具有高度的临床代表性和实际意义;其四,具备天然纵向追踪能力,可对患者进行长期随访,评估治疗的远期疗效和安全性。

图2. 医保数据的独特价值

宋玉琴教授以北京医保数据库中的套细胞淋巴瘤患者数据为例,生动展示了数据挖掘的成果。分析发现,98%的患者首诊于医院,仅2%在基层机构,揭示了该疾病诊疗的集中性。更重要的是,数据清晰描绘了治疗模式的演变趋势:已有40%-50%的患者在初始治疗中就选择了以BTK抑制剂为基础的靶向方案,且这一比例逐年上升,标志着治疗范式正在从传统化疗免疫(化免)方案向靶向治疗转变。深入追踪发现以BTK抑制剂起始治疗的患者维持原方案的比例较高,而初始采用化免方案的患者在更换治疗时,也首选BTK抑制剂方案。这些源于真实世界的洞察,为临床医生在指南证据不足或患者不符合RCT标准时,选择最优治疗策略提供了极具价值的参考。

图3. 北京医保数据库的套细胞淋巴瘤患者数据

临床实践循证:人工智能驱动的决策革命

循证医学是现代临床实践的基石,但其传统模式正面临信息爆炸的挑战。宋玉琴教授指出,即便是UpToDate这样的权威临床决策支持系统,其引用的文献量也仅占海量发表研究的很小一部分(1.5%),医生难以手动追踪和消化所有最新证据。

大模型技术的出现,为循证医学带来了一场效率与质量的双重革命。首先,它实现了前所未有的高效文献检索与整合。医生只需通过自然语言提问,AI便能快速梳理浩瀚文献库,生成结构清晰、重点突出的研究综述,极大节省了时间成本。其次,它显著降低了证据理解的门槛。AI不仅能提供研究摘要,还能解释复杂的统计指标并剖析其临床意义,使年轻医生或不同专业的医生也能轻松掌握核心证据。第三,它推动了个体化医疗的落地。大模型能够实时解析最新临床指南,并无缝对接患者的具体信息,生成高度个性化的治疗方案参考,真正实现了“从检索到应用”的瞬间闭环。

图4. 大模型辅助下的医学循证实践变化

此外,AI还是培养循证思维的有力工具。它能提供循证推理的示范和即时反馈,帮助年轻医生系统性地学习如何批判性地评估和应用证据。同时,AI具备强大的跨学科知识融合能力,能为复杂的疑难病例提供更全面、立体的证据视野,辅助多学科诊疗(MDT)讨论。宋玉琴教授透露,其团队正在构建淋巴瘤专科知识库,为确保权威性与全面性,不仅收录高影响力期刊的研究成果,也系统纳入影响因子在2-4分之间的重要期刊文献,旨在打造一个真正服务于临床决策的动态知识体系。

图5. 淋巴瘤专科知识库建设

临床研究新范式:AI全链条赋能科研创新

数据与技术的融合,最终催生了临床研究范式的根本性变革。宋玉琴教授描绘了AI技术如何全链条赋能科研创新,覆盖从灵感发现到方案设计的全过程。

图6. AI技术全链条赋能临床研究创新

在科研灵感发现阶段,AI可以辅助研究者完成两项繁重工作:一是撰写详尽的文献综述,全面梳理某一领域的发展现状;二是构建证据图谱(Evidence Gap Map, EGM),直观地揭示现有研究的分布和空白,从而精准定位有价值的研究方向。这些由AI生成的内容并非泛泛而谈,而是在领域专家指导下反复打磨,数据详实、论述深刻。在研究方案设计阶段,AI能够辅助科学家快速撰写高质量、可落地的研究方案。用户可以通过交互方式,自主控制从大纲设计、文献选择到撰写风格和章节优化的全过程,实现“高度可控”的智能辅助写作。

图7. AI撰写综述,辅助寻找科研灵感

最关键的是,这一切都建立在严谨与真实的基础之上。宋玉琴教授特别强调,通过采用RAG和AI自我反思等先进技术,可以确保AI输出的每一句话、每一个结论都源自真实文献,并可追溯至原文,有效避免了内容“幻觉”,保证了科研的严肃性。

总结:拥抱变革,从今天开始

宋玉琴教授的报告最终落脚于行动号召。她指出,拥抱数据驱动的新范式并非遥不可及,每一位临床医生都可以从当下开始:转变思维,将日常工作中遇到的困惑和难题转化为可被数据验证的科学问题;重视数据资产,意识到医保数据等真实世界数据是蕴藏丰富的“金矿”;善用工具赋能,主动学习和掌握包括大模型在内的AI科研工具,提升研究效率;最终实现跨界合作共赢,临床医生与数据科学家紧密协作,共同解锁数据中的价值。

综上所述,数据驱动的临床研究新范式,以医保数据挖掘为基石,以AI增强循证为引擎,正全方位地重塑着医学研究的流程与内涵。它不仅是方法的升级,更是思维的革命,预示着未来医疗将更加智能、精准和以患者为中心。

专家简介

宋玉琴 教授

北京大学肿瘤医院

医学博士、主任医师、教授、博士研究生导师,北京大学肿瘤医院副院长、淋巴肿瘤内科副主任。

长期专注于淋巴瘤诊疗与转化研究,建立了淋巴瘤新药临床研究设计和基础快速转化体系。带领团队牵头/参与开展国内外临床注册研究200项,占中国淋巴瘤新药研发的75%以上,共计促成了二十一种抗淋巴瘤新药或新适应症获批。

先后承担国家自然科学基金,科技部重大专项子课题、省级优秀中青年科学家基金及北京市自然科学基金等多项课题;发表SCI论文50余篇,影响因子超过 200 ,主译学术专著3部。

担任中国临床肿瘤学会(CSCO)理事,中国临床肿瘤学会(CSCO)抗淋巴瘤专家委员会秘书长,北京抗癌协会淋巴血液肿瘤专业委员会主任委员,国家卫健委能力建设和继续教育中心—淋巴瘤专科建设项目专家组顾问及秘书长,中国人体健康促进会淋巴瘤专业委员会主任委员,中国老年肿瘤学会淋巴血液肿瘤专业委员会副主任委员。

享受国务院政府特殊津贴,荣获中华医学科技进步奖二等奖、第四届国之名医优秀风范奖

*医学界力求其发表内容专业、可靠,但不对内容的准确性做出承诺;请相关各方在采用或以此作为决策依据时另行核查。