大语言模型自动化分析死亡报告技术实现
摘要
预防未来死亡(PFD)报告由英格兰和威尔士的验尸官发布,用于标记可能导致更多生命损失的系统性风险。传统上,这些报告的分析需要大量人工识别和编码工作。2025年,某机构发布了针对儿童自杀PFD报告的国家主题审查(年龄≤18岁),从2015年1月至2023年11月期间识别出37个案例——这一过程完全基于人工整理和编码。
方法
研究评估了全自动化、开源的"文本到表格"语言模型流程(PFD Toolkit)是否能够复现某机构对儿童自杀PFD报告的识别和主题分析,并评估了效率和可靠性的提升。处理了2013年7月至2023年11月期间发布的所有4,249份PFD报告。
技术实现
自动化筛查识别了验尸官将死亡归因于自杀且年龄在18岁或以下的案例,符合条件报告按照接收者类别和23个关注子主题进行编码,复现了某机构的编码框架。
结果
PFD Toolkit识别出72份儿童自杀PFD报告——几乎是某机构数量的两倍。三位盲审临床医生对144份报告的分层样本进行裁定,以验证儿童自杀筛查。基于共识后的临床标注,LLM工作流程显示出基本到几乎完美的一致性(Cohen's κ = 0.82,95% CI:0.66-0.98,原始一致性=91%)。
效率提升
端到端脚本运行时间为8分16秒,将原本需要数月的流程转变为可在几分钟内完成的过程。这表明自动化LLM分析能够可靠且高效地复现人工对验尸官数据的主题审查,为公共卫生和安全提供可扩展、可重复且及时的分析洞察。
可用性
PFD Toolkit已公开提供,可供未来研究使用。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
公众号二维码


浙公网安备 33010602011771号