PsyLite技术报告:轻量化心理咨询AI助手
原文标题:PsyLite Technical Report
作者:Fangjun Ding, Renyu Zhang, Xinyu Feng, Chengye Xie, Zheng Zhang, Yanting Zhang
原文摘要:With the rapid development of digital technology, AI-driven psychological counseling has gradually become an important research direction in the field of mental health. However, existing models still have deficiencies in dialogue safety, detailed scenario handling, and lightweight deployment. To address these issues, this study proposes PsyLite, a lightweight psychological counseling large language model agent developed based on the base model InternLM2.5-7B-chat. Through a two-stage training strategy (hybrid distillation data fine-tuning and ORPO preference optimization), PsyLite enhances the model's deep-reasoning ability, psychological counseling ability, and safe dialogue ability. After deployment using Ollama and Open WebUI, a custom workflow is created with Pipelines. An innovative conditional RAG is designed to introduce crosstalk humor elements at appropriate times during psychological counseling to enhance user experience and decline dangerous requests to strengthen dialogue safety. Evaluations show that PsyLite outperforms the baseline models in the Chinese general evaluation (CEval), psychological counseling professional evaluation (CPsyCounE), and dialogue safety evaluation (SafeDialBench), particularly in psychological counseling professionalism (CPsyCounE score improvement of 47.6%) and dialogue safety (safe score improvement of 2.4%). Additionally, the model uses quantization technology (GGUF q4_k_m) to achieve low hardware deployment (5GB memory is sufficient for operation), providing a feasible solution for psychological counseling applications in resource-constrained environments.
中文翻译:随着数字技术的快速发展,AI驱动的心理咨询已逐渐成为心理健康领域的重要研究方向。然而,现有模型在对话安全性、详细场景处理和轻量化部署方面仍存在不足。为解决这些问题,本研究提出了PsyLite,这是一个基于InternLM2.5-7B-chat基础模型开发的轻量化心理咨询大型语言模型代理。通过两阶段训练策略(混合蒸馏数据微调和ORPO偏好优化),PsyLite增强了模型的深度推理能力、心理咨询能力和安全对话能力。在使用Ollama和Open WebUI进行部署后,通过Pipelines创建了自定义工作流。设计了创新的条件RAG技术,在心理咨询过程中适时引入相声幽默元素以增强用户体验,并拒绝危险请求以加强对话安全性。评估显示,PsyLite在中文通用评估(CEval)、心理咨询专业评估(CPsyCounE)和对话安全评估(SafeDialBench)中优于基线模型,特别是在心理咨询专业性(CPsyCounE分数提升47.6%)和对话安全性(安全分数提升2.4%)方面。此外,该模型使用量化技术(GGUF q4_k_m)实现低硬件部署(5GB内存即可运行),为资源受限环境中的心理咨询应用提供了可行解决方案。
智能问答:
Q: 这篇论文试图解决什么问题?
A: 这篇论文试图解决在心理健康领域中,人工智能驱动的心理咨询模型存在的几个关键问题:对话安全性不足,现有的AI心理咨询模型在处理敏感话题或潜在危险请求时,可能无法有效识别和拒绝,存在输出有害信息的风险;详细场景处理能力有限,在处理复杂的心理咨询场景时,现有模型可能无法提供足够专业、深入且结构化的回答,缺乏深度推理和专业心理咨询知识的应用;轻量化部署困难,一些性能较好的大型语言模型需要较高的硬件资源才能运行,这限制了它们在资源受限环境中的应用,如一些小型医疗机构或个人设备上难以部署。
Q: 有哪些相关研究?
A: 论文中提到了以下相关研究:1. InternLM2,研究内容为InternLM2是一个开源的大型语言模型,它在多个维度和30个基准测试中表现优异,特别是在长文本建模和开放性主观评估方面。本文基于InternLM2进行扩展,利用其在长文本建模和推理能力方面的优势。2. CPsyCoun,研究内容为CPsyCoun是一个基于报告框架的中文心理咨询多轮对话重构和评估体系。本文使用CPsyCoun的数据集和评估标准来训练和评估PsyLite模型。3. SafeDialBench,研究内容为SafeDialBench是一个用于评估大型语言模型在多轮对话中安全性的细粒度基准。本文使用SafeDialBench来评估PsyLite模型在对话安全性方面的表现。4. DeepPsy-Agent,研究内容为DeepPsy-Agent是一个结合心理学三阶段辅助理论和深度学习技术的情感支持智能代理系统。本文借鉴了DeepPsy-Agent的动态阶段感知和深度推理能力。5. EmoLLM,研究内容为EmoLLM是一个心理健康大型模型,支持"理解用户-支持用户-帮助用户"的心理健康咨询链。本文参考了EmoLLM的数据构建和多阶段微调方法。6. SoulChat,研究内容为SoulChat是一个集成了多种心理健康核心技术的模型,旨在提供个性化的情感支持和认知行为疗法。本文借鉴了SoulChat的技术,以增强PsyLite模型在情感支持和认知行为疗法方面的功能。
Q: 论文如何解决这个问题?
A: 为了解决现有AI心理咨询模型在对话安全性、详细场景处理和轻量化部署方面的不足,论文提出了PsyLite模型,并通过以下方法解决问题:1. 模型训练。混合蒸馏数据微调:数据集构建,结合通用领域数据和心理咨询领域数据,按照10:3的比例混合;QLoRA监督微调,以InternLM2.5-7B-chat为基础模型,采用QLoRA技术进行监督微调。ORPO偏好优化:数据集构建,使用PKU-SafeRLHFsingle-dimension数据集构建偏好优化数据集;