摘要: 【 目的/意义】当前,通过对社交媒体用户数据的分析来对其心理与行为进行识别已成为学术界的研究前 沿。健康焦虑已成为公众的主要心理问题之一。本文旨在通过文本自动分类识别出社交媒体环境下具有健康焦 虑倾向的用户。【方法/过程】以微博作为数据来源,采集以“健康焦虑”为关键词的相关数据,通过数据清洗、标注、 文本向量化表示和分类模型构建来识别具有健康焦虑倾向的用户。【结果/结论】 RoBERTa-wwm模型的识别效果 优于 Bert-base-Chinese 等模型,将 RoBERTa-wwm 预训练语言模型生成的词向量与 COMET 模型生成的心理状 态特征向量进行拼接融合,能够更好地对文本语义进行特征表示;基于门控循环单元、缩放点积注意力机制和全连 接层构建的健康焦虑识别模型表现最好。【创新/局限】本研究构建了社交媒体环境下用户健康焦虑识别模型,对模 型的识别效果进行了评价。研究结果可为用户健康焦虑预测与识别系统构建、网络健康群体的心理安全监测提供 有益参考。研究局限为选取的社交媒体平台数据来源较为单一。