摘要: 【 目的/意义】探索信息疫情背景下社交媒体中真伪信息的主题特征,研究社交媒体平台评论信息特征及真 伪识别问题,为用户和社交媒体平台信息识别提供参考依据。【方法/过程】针对社交媒体平台上疫情相关的多主题 数据,以 Twitter 平台推文为数据集。运用 LDA 模型,提取真实信息和虚假信息的主要表述和语义特征。引入 BERT 预处理方式,融合双向长短时记忆网络算法,构建 BERT-BiLSTM 混合模型,识别虚假疫情信息。【结果/结 论】基于 LDA主题模型的对比研究,发现真实和虚假信息在主题和表述特征上存在显著差异。通过与传统机器学 习算法进行比较,BERT-BiLSTM模型对虚假疫情信息识别具有显著优势,准确率达到0.960,F1值为0.961。因此, 本文构建的BERT-BiLSTM模型将为虚假信息识别提供更精准、高效的解决方案。【创新/局限】以社交媒体平台疫 情信息为研究对象,综合运用LDA主题模型探究了疫情信息的特征,在小规模数据集上以较低成本实现了多主题 数据的有效识别,为信息疫情治理提供了高效的解决方案。