入选国际顶级会议AAAI!健成星云自研心理大模型论文,获国际学界肯定!

近期,深圳健成星云科技有限公司关于自主研发的心理咨询对话生成技术成果论文《MCTSr-Zero: Self-Reflective Psychological Counseling Dialogues Generation via Principles and Adaptive Exploration》入选AAAI 2026。

AAAI人工智能会议(AAAI Conference on Artificial Intelligence)由人工智能促进会(AAAI)主办,是人工智能领域历史最悠久的国际学术会议之一,也是中国计算机学会(CCF)推荐的A类国际会议。作为全球人工智能研究的风向标,AAAI一直以录用标准严格著称。本篇论文的入选,意味着健成星云在心理AI基础方法、模型训练策略与评估体系设计上的探索,已得到国际学界的高度肯定。

本文针对开放式、以人为本的对话场景,创新性地提出了基于蒙特卡洛树搜索(MCTS)的对话生成框架MCTSr-Zero。该框架通过动态元提示与原则引导的自我评估来生成高质量心理咨询对话,并在此基础上构建了多轮心理咨询专用大模型PsyLLM、多维度AI对话评估体系PsyEva,解决了长期以来通用大模型在开放式心理对话中存在的诸多难题,为AI心理大模型的可信赖性和专业度提供了新的技术路径。

3技术内核

基于现实需求
创新性提出MCTSr-Zero

与具有明确目标和可验证正确性的任务不同,心理咨询对话是一类缺乏标准答案的开放式人本交互任务。在此类场景中,对话质量并不取决于单一结果的正确性,而更依赖于共情参与、伦理遵循以及与人类偏好的匹配等主观因素。论文分析指出,尽管蒙特卡洛树搜索(MCTS)与大语言模型(LLMs)的结合在结构化、结果导向型任务中已取得良好效果,但将其直接应用于心理咨询对话生成仍面临显著挑战。

一方面,开放式对话缺乏明确的终止状态和客观评价标准,模型生成过程容易出现路径重复或偏离咨询目标;另一方面,真实心理咨询数据受限于隐私与伦理,训练过程高度依赖合成数据,而现有的合成数据往往缺乏专业性和结构控制,往往难以深度理解并持续一致地遵循复杂、抽象且开放的心理咨询标准。因此,现阶段主流技术路线在心理咨询这一高度专业、过程敏感的场景中,往往难以达到实际应用所需的稳定性和专业度。

为应对上述挑战,团队基于MCTS提出对话生成框架MCTSr-Zero。在框架设计上,MCTSr-Zero主要包含两项关键机制。首先是核心创新「领域对齐」(Domain Alignment),该机制将搜索目标从预定义的终止状态转向符合目标领域原则(例如咨询中的共情)的对话轨迹。其次是「再生成」(Regeneration)与「元提示自适应」(Meta-Prompt Adaptation)机制,通过修改指导性的元提示算法,探索本质上完全不同的初始对话策略,极大地拓宽了搜索空间,使模型能够尝试更多样的沟通方式来认知复杂的咨询场景。

图片111

构建PsyLLM
并提出PsyEval进行标准化评估

基于MCTSr-Zero框架,团队从在线心理健康资源中收集主题并组织成案例场景,生成了包含4000条多轮心理咨询对话的高质量数据集(MCTSr-Zero-Psy),并利用该数据集对开源基础模型微调后,得到两个心理专用模型——PsyLLM-Mini和PsyLLM-Large。

为系统评估多轮心理咨询对话质量,团队还构建了PsyEval,一套面向心理咨询对话的多维评测基准。PsyEval采用16个评估维度,从第三方观察视角对模型在多轮对话中的可观察咨询能力进行评价。其维度设计综合了治疗师共情量表(TES)、共情系统人机交流(ESHCC)、动机性访谈(MI)以及人本主义等相关研究成果,还特别引入了对话逻辑一致性、对话连续性、阻抗处理、伦理/亲社会引导、总结能力以及对话节奏/过程协调对心理咨询至关重要的新维度等关键指标,并依据严格的评分机制进行自动化打分,确保了评估的可扩展性与一致性。

在PsyEval体系下的对比实验结果显示数据显示,PsyLLM-Large 和 PsyLLM-Mini,分别取得了90.93和90.72的最高总分,全面超越其他被评估的主流心理模型,具有明显优势。

作为一家深耕心理健康科技的企业,健成星云科技始终坚持以科学严谨为底线、以技术普惠为方向。MCTSr-Zero框架、PsyLLM模型与PsyEval基准的提出与构建,不仅是公司在心理AI基础研发领域的重要科研成果,也为推动心理支持服务向更专业化、标准化与可信赖的方向发展提供了新的工具与思路。健成星云也将继续深化人工智能与心理学的交叉研究,致力于开发更符合人文关怀与专业标准的智能技术。

posted @ 2026-01-16 12:05  健成星云  阅读(0)  评论(0)    收藏  举报