法医学杂志

期刊简介

  《法医学杂志》(CN 31-1472/R,ISSN 1004-5619)创刊于1985年7月,由中华人民共和国司法部主管、司法部司法鉴定科学技术研究所主办,是我国第一本向国内外公开发行的国家级法医学专业学术刊物。本刊创刊时为每期48页季刊,1996年改为每期64页,2005年改为每期80页,2006年变更为每期80页双月刊。2009年起正文纸张由80克双胶纸改为80克UPM雅光纸,采用了图文混排方式。

  《法医学杂志》的办刊宗旨为:提供法医学及其相关学科的新理论、新技术、新方法等信息,为维护司法公正、贯彻依法治国的方略服务,促进国内外同行的学术交流和本学科的发展。

  《法医学杂志》刊登的主要内容包括:法医病理学、法医临床学、法医物证学、司法精神病学、法医毒理学、法医昆虫学和毒(药)物分析、医疗纠纷、医疗事故的法医学鉴定以及交通事故鉴定等现代司法鉴定科学方面的最新成果和动态。既刊登大量国家自然科学基金等大型项目资助的创新性科研成果,也刊登许多对实际鉴定工作大有帮助的实用性技术和经验交流类文章,全面地为法医工作者提供科研、教学、检案等方面的新动向、新进展、新技术、新经验。

  开设的栏目有:研究论著、技术与应用、案例分析、经验交流、医疗纠纷、疑难案例报道、综述、专题讲座和教育培训等。

  主要作者和读者群为:公安、检察、法院、司法行政系统等部门的法医工作者,各类司法鉴定机构中的法医学鉴定人,高校法医院系、法律系的师生,卫生医疗单位的医务人员和法律工作者。

  本刊编辑部多年来奉行高水平、高质量、高品位的办刊方针,在办刊中严格执行有关国家标准和规范以及审校制度,编辑人员对稿件的处理精益求精。录用文章学术水平高,实用性强,栏目内容丰富,版面设计合理,图表制作精确,印刷装帧精良,深受法医学界专业人员、高校师生及司法鉴定领域中相关人员的欢迎和认可。为促进法医学学科发展、提高本学科的科研和检案水平以及法医学人才培养作出了重要贡献。

  本刊自1997年被美国生物医学文献资料数据库MEDLINE收录,是中国第一也是目前唯一一本进入该数据库的法医学类期刊。自1999年起陆续被《万方数据》、《中国学术期刊(光盘版)》、《中国学术期刊综合评价数据库》统计源期刊、《中国期刊全文数据库》、《中国核心期刊(遴选)数据库》等全文收录;被全国医学综合性检索工具《中文科技资料目录-医药卫生》列为核心期刊收录;获首届《CAJ-CD规范》执行优秀期刊奖。2008年起本刊被确定为荷兰医学文摘(EMBASE)数据库收录期刊和中国《全国报刊索引》核心期刊。2009年被“中国科技论文统计源期刊”(中国科技核心期刊)收录。2011年被中国科学引文数据库(CSCD)收录。2012年被Elsevier公司二次文献数据库(Scopus)收录。2013年 超星数字期刊。2015年 第四届《中国学术期刊评价研究报告(武大版)(2015-2016)》中,被评为“RCCSE中国核心学术期刊(A)”。2016年4月《法医学杂志》被中国社会科学院中国社会科学评价中心《中国人文社会科学期刊评价报告(AMI)》的引文数据库收录为来源刊;10月,获准加入WHO西太平洋区医学索引(The Western Pacific Region Index Medicus, WPRIM)。

  根据期刊引证报告最新统计,《法医学杂志》影响因子逐年上升,目前在法医学类期刊中,其影响因子名列榜首。

               

​基于机器学习的早期脓毒症 4 小时预警模型构建、多中心验证与可解释性分析

时间:2025-08-28 16:49:19

摘要  

背景:脓毒症每延迟 1 小时抗菌治疗,病死率增加 7.6%。传统评分(SOFA、qSOFA)依赖 ICU 完整数据,早期识别灵敏度不足。  

目的:利用入院 1 小时内常规检验指标,构建可解释的机器学习(ML)早期脓毒症 4 小时预警模型,并在多中心独立队列中验证其性能与公平性。  

方法:回顾性收集 2019-2022 年 6 家三级医院 ICU 共 18 463 例患者数据(训练集 14 445,内部验证 2 018,外部验证 4 018)。采用 XGBoost、LightGBM、CatBoost、逻辑回归等 8 种算法;最终模型以 XGBoost 为骨干,输入 47 项变量(生命体征 8、实验室 31、基础信息 8)。主要指标:4 小时内发生脓毒症的 AUROC;次要指标:灵敏度、特异度、F1、校准度(Brier 分数)、公平性(年龄、性别、合并症亚组差异 ΔAUROC<0.03)。解释性:SHAP 全局与局部解释。  

结果:最终 XGBoost 模型在训练集 AUROC 0.93(95%CI 0.92-0.94),内部验证 0.91,外部验证 0.88。灵敏度 88%,特异度 83%,Brier 分数 0.082。亚组分析显示老年(≥65 岁)、免疫抑制、肝硬化患者 ΔAUROC 均 <0.02。SHAP 揭示乳酸、呼吸频率、白细胞、PCT 为最重要特征。  结论:该模型可嵌入医院信息系统(HIS),实现床旁实时预警,提前 4 小时识别脓毒症,具良好校准度与公平性。  

关键词:脓毒症;机器学习;早期预警;XGBoost;可解释性;多中心验证

1 引言  

1.1 脓毒症流行病学  

全球每年 4 900 万脓毒症病例,死亡 1 100 万[1]。中国重症监护病房(ICU)脓毒症发生率 20.6%,住院病死率 28.5%[2]。  

1.2 早期识别困境  

传统 SOFA、qSOFA 需完整实验室及生命体征,急诊或普通病房难以快速完成;且灵敏度仅 60%-70%[3]。  

1.3 机器学习机遇  

电子病历(EMR)累积海量数据,为 ML 提供原料。然而,“黑箱”特性阻碍临床采纳,亟需可解释模型。  

1.4 研究目的  

构建基于入院 1 小时内常规数据的 ML 预警模型,完成多中心验证,并提供透明化解释,为临床决策支持系统(CDSS)落地提供依据。

2 资料与方法  

2.1 研究设计  

回顾性队列 + 多中心外部验证。遵循 TRIPOD-ML、PROBAST 指南[4]。  

2.2 数据来源  

训练集:华中科技大学同济医院、湘雅医院、四川省人民医院 ICU(2019-01-01 至 2022-06-30)。  

外部验证:北京协和、上海瑞金、广州中山 ICU(2022-07-01 至 2023-03-31)。  

伦理:各院伦理豁免(回顾性),编号 TJ-2023-ML-01。  

2.3 纳排标准  

纳入:≥18 岁;ICU 住院时间 ≥24 h;入院 1 小时内完成生命体征及首次实验室检查。  

排除:入院时已明确脓毒症、妊娠、资料缺失 >20%。  

2.4 脓毒症定义  

采用 Sepsis-3:感染证据 + SOFA≥2。感染证据:细菌培养阳性或临床诊断且抗菌药使用 ≥3 天。  

2.5 数据提取  

47 项变量:  

生命体征 8:收缩压、舒张压、平均动脉压(MAP)、心率、呼吸频率、体温、SpO₂、意识评分(GCS)。  

实验室 31:乳酸、白细胞、中性粒细胞百分比、血红蛋白、血小板、PT、APTT、INR、D-二聚体、PCT、CRP、血糖、肌酐、尿素氮、eGFR、总胆红素、白蛋白、ALT、AST、Na⁺、K⁺、Cl⁻、Ca²⁺、Mg²⁺、HCO₃⁻、pH、PaO₂、PaCO₂、氧合指数、尿素/肌酐比值。  

基础信息 8:年龄、性别、BMI、合并症(高血压、糖尿病、冠心病、慢阻肺、肝硬化、免疫抑制)。  

2.6 数据预处理  

缺失值:连续变量多重插补(MICE),分类变量单独“未知”类别。异常值:3SD 之外 winsorize。标准化:Z-score。  

2.7 模型开发  

8 种算法:逻辑回归、随机森林、SVM、K-近邻、神经网络、XGBoost、LightGBM、CatBoost。  

超参数优化:贝叶斯优化 100 次迭代。  

特征选择:Boruta + SHAP top 30。最终保留 22 项(表 2)。  

2.8 验证策略  

内部:5 折交叉验证 + 内部验证集。外部:完全独立 4 018 例。  

2.9 性能指标  

AUROC、AUPRC、准确率、灵敏度、特异度、F1、Brier 分数、校准曲线(Platt scaling)。  

2.10 可解释性  

全局:SHAP 总体条形图、蜂群图。  

局部:SHAP waterfall 解释单例预测。  

2.11 公平性分析  

亚组:性别、年龄(<65/≥65)、免疫抑制、肝硬化、糖尿病。ΔAUROC<0.03 视为公平。  

2.12 统计与软件  

Python 3.9(scikit-learn 1.2, XGBoost 1.7, SHAP 0.41)。双侧 P<0.05。

3 结果  

3.1 基线特征  

18 463 例中脓毒症 4 小时发生率 12.8%。训练、内部、外部人群基线均衡(表 1)。  

3.2 模型性能  

XGBoost 最优:训练 AUROC 0.93,内部 0.91,外部 0.88。外部验证灵敏度 88%,特异度 83%,F1 0.57,Brier 0.082,校准良好(图 2)。  

3.3 特征重要性  

SHAP 全局:乳酸、呼吸频率、PCT、白细胞、GCS、INR、血糖、体温、D-二聚体、血钠(图 3A)。  

局部示例:83 岁男性,乳酸 4.2 mmol/L、呼吸 28 次/分,模型提前 3.5 h 预警,实际 2 h 后确诊。  

3.4 亚组公平性  

所有亚组 ΔAUROC 0.01–0.02,无统计学差异(图 4)。  

3.5 与传统评分比较  

qSOFA AUROC 0.64,SOFA 0.72,NEWS2 0.75,均显著低于 ML 模型(P<0.001)。  

3.6 决策曲线分析  

阈值概率 5%–50% 范围内,ML 模型净获益高于传统评分(图 5)。

4 讨论  

4.1 主要发现  

基于 47 项入院 1 小时内常规指标构建的 XGBoost 模型,在多中心外部验证中保持 0.88 AUROC,提前 4 小时预警脓毒症,显著优于传统评分。  

4.2 关键变量  

乳酸、呼吸频率、PCT 为前三重要特征,与生理机制一致:乳酸反映组织低灌注;呼吸频率升高提示代偿;PCT 为细菌感染特异指标。  

4.3 可解释性  

SHAP 提供全局与局部解释,帮助临床医生理解“为何预警”,提高接受度。  

4.4 公平性  

模型在老年、免疫抑制、肝硬化患者表现一致,避免因数据偏差导致歧视。  

4.5 与既往研究比较  

既往研究多基于 ICU 丰富变量,AUROC 0.80–0.85[5,6]。本研究仅用入院 1 小时内常规数据,外部验证 0.88,更具普适性。  

4.6 临床转化  

模型已封装为 RESTful API,嵌入 HIS,实时输出风险评分及解释图(图 6)。  

4.7 局限性  

回顾性设计存在残余混杂;外部验证仅三家医院;未评估干预效果(预警后临床响应)。  

4.8 未来方向  

前瞻性实施研究(Stepped-wedge cluster RCT)验证预警后干预能否降低病死率;扩大基层医院验证。

5 结论  

基于入院 1 小时内常规数据的 XGBoost 模型,可在多中心独立人群中提前 4 小时准确、公平地预警脓毒症,具备良好的校准度与可解释性,适合嵌入 CDSS 推广。

致谢  

感谢 6 家医院 ICU、信息科及数据治理团队。

参考文献(节选)  

[1] Rudd KE, et al. Lancet. 2020;395(10219):200-211.  

[2] Xie J, et al. Crit Care. 2022;26(1):1-12.  

[3] Seymour CW, et al. JAMA. 2016;315(8):801-810.  

[4] Collins GS, et al. BMJ. 2023;378:e070441.  

[5] Johnson AE, et al. Crit Care Med. 2018;46(7):e669-e677.  

[6] Nemati S, et al. NPJ Digit Med. 2018;1:89.