机器学习助力识别自杀风险的技术研究

机器学习的应用:从语言到心理健康

Philip Resnik在哈佛大学攻读计算机科学本科期间,因陪同朋友旁听语言学课程而对语言产生了浓厚兴趣。凭借其技术背景,他自然地从计算角度研究这一课题。

如今,作为马里兰州大学语言学系和高级计算机研究所的教授,Resnik从事计算语言学研究已超过30年。他的目标之一是利用技术推动社会问题的解决。在临床心理学家妻子Rebecca Resnik的影响下,他对应用计算模型识别与心理健康相关的语言信号特别感兴趣。“语言是洞察人们心理状态的关键窗口,”Resnik说。

在机器学习研究奖的支持下,他和同事目前正应用机器学习技术分析社交媒体数据,试图对心理健康的重要方面(包括自杀风险)进行预测。开发更复杂的工具来预防自杀在美国是一个紧迫的问题。根据疾病控制与预防中心的数据,2018年,自杀是10至34岁人群的第二大死因。在那一年所有年龄段中,超过48,000名美国人死于自杀。Resnik指出,新冠疫情通过“回声疫情”(指持续隔离、焦虑和正常生活被打乱所带来的长期心理健康影响)进一步加剧了该问题的紧迫性。

社交媒体数据的价值

历史上,关于心理健康的机器学习研究项目依赖各种类型的数据,如健康记录和临床访谈。但Resnik和其他研究人员发现,社交媒体提供了额外的信息层,可以窥见患者在未接受心理健康服务提供者评估时的日常体验。考虑到隐私和伦理问题,Resnik设想了一个系统,让已经在接受心理健康治疗的患者可以选择同意将其社交媒体数据用于监测目的。

“与许多人每天都在社交媒体上发布生活经历相比,能够发现问题的医疗访问次数相对较少且间隔较长,”Resnik说。其理念是利用社交媒体数据来发现可预测的模式,例如,精神分裂症患者何时可能出现精神病发作,或抑郁症患者何时可能出现自杀危机。

该项目仍处于技术研究阶段,Resnik表示,但最终目标是通过让心理健康专业人员获取关于他们正在帮助治疗的人的、以往无法获得的信息,从而产生实际影响。

这些预测是通过监督式机器学习实现的。在这种场景下,模型利用由社交媒体帖子组成的数据集,在给定大量正确示例后,学习如何识别模式或属性以做出预测。

为了开展这项工作,Resnik和同事们使用了来自“OurDataHelps”和“OurDataHelps: UMD”两个网站的志愿者捐赠的社交媒体数据,以及来自Reddit的数据。他们的所有工作都经过严格的伦理审查,并采取额外步骤对用户进行匿名化处理,例如自动屏蔽任何看起来像姓名或位置的内容。

优先处理高危个体

先前使用机器学习进行心理健康预测的研究通常旨在进行二元区分。例如:是否应将此人标记为有风险?然而,Resnik和他的团队认为,仅仅标记可能需要关注的人是不够的。

根据卫生人力局的数据,在美国,有超过1.2亿人生活在心理健康服务提供者短缺的地区。“这意味着,即使他们知道自己需要心理健康方面的帮助,也可能很难见到心理健康服务提供者,因为提供者数量不足,”Resnik指出。

当软件在一个已经负担过重的系统中识别出更多可能需要帮助的人时,会发生什么?他说,答案是找到方法来帮助优先处理最需要尽快关注的病例。

因此,Resnik的团队将重点从简单的分类转向了优先级排序。其中一种方法是,告知医疗服务提供者哪些患者风险更高,需要最立即的关注。该系统不仅会对风险最高的个体进行排名,还会为每个人排名哪些社交媒体帖子最能反映其心理状态。这样,当提供者收到警报时,他们不必翻阅可能数百条社交媒体更新来更好地评估该人的状况,而是会首先看到最令人担忧的帖子。

Resnik和同事在最近的一篇论文中描述了这一点。尽管这个想法尚未被临床医生付诸实践,但它是在与诸如美国自杀学协会等组织的专家协商后开发的,这些专家就如何设计这些技术以使其既有效又合乎道德提供了宝贵的意见和反馈。

Resnik的团队还在研究另一种患者优先级排序方法,该系统将依赖于多个阶段的患者评估。例如,可以在第一阶段以非侵入性的方式评估患者的社交媒体数据。然后,一部分个体可能会被邀请进入第二阶段,这是一个互动阶段,例如通过一个自动系统回答问题,他们的答案以及言语特征(例如语速和音质)将通过机器学习技术进行评估。其中,处于最直接或严重风险的个体可能被引导至第三阶段评估,该阶段将涉及真人参与。

“你有一个管道,在评估患者的每个阶段,都可能有一个适当的干预措施,”Resnik说。“其理念是在整个人群中找到合适的护理级别,而不是简单地做出二元区分。”

这两种方法都得到了MLRA的支持。“这不仅在用于构建基础设施的AWS积分和研究生资助方面有所帮助,而且在与某机构人员的互动方面也有益,”Resnik说。“我们与AWS内部负责构建重要工具的人员进行了积极的对话。我作为研究人员与某机构的关系非常有帮助。”

为敏感数据构建安全环境

MLRA之前的资助也帮助赞助了一个安全计算环境的开发,用于存储心理健康数据。这是推进心理健康机器学习研究的重要一步,因为该领域的主要障碍之一就是获取这些非常敏感的数据。

马里兰大学和芝加哥大学独立研究机构NORC之间这个合作项目的目标是:让合格的研究人员能够以合乎道德且安全的方式访问心理健康数据集。由此产生的心理健康数据安全区托管在AWS上,旨在让研究人员从自己的计算机远程访问数据集,并在安全环境中处理数据,而永远无法将数据复制或发送到其他地方。

该安全区将于今年春季在计算语言学和临床心理学研讨会(与NAACL联合举行)上用于一项练习,该活动汇集了临床医生和技术专家。一个敏感的心理健康数据集将在不同的团队之间共享,他们将在安全区内处理数据以解决问题。解决方案随后将在研讨会上进行讨论。

Resnik表示,AWS奖项将使所有团队能够以合乎道德的方式访问并处理这些敏感数据。“我将其视为一个概念验证,我希望这将成为一个持久的范式,即我们使用安全环境让社区以共享的方式处理敏感数据,”他补充道。“这是其他研究领域几十年来取得真正进展的方式。”

然而,至关重要的是,Resnik观察到,研究进展本身并不是目的:最终需要将其融入到心理健康护理生态系统中的实际和伦理部署中。正如他和合作的预防自杀专家在最近一篇文章中指出的那样:“进步的关键在于自杀学和技术社区之间更密切、更持续的合作。”
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

公众号二维码

公众号二维码

posted @ 2025-12-29 22:59  CodeShare  阅读(3)  评论(0)    收藏  举报