摘要: 【目的/意义】利用SHAP解释方法对在线问诊平台信息采纳行为预测模型进行可解释性分析,以识别信息 采纳行为的重要影响因素及其作用方式。【方法/过程】首先,依据信息采纳模型从信息质量和信息源可信度维度提 取问答文本相关候选特征变量,并利用相关性分析对其进行筛选;其次,利用多个集成学习经典算法构建信息采纳 行为预测模型,并利用相关性能指标对其进行评价和选择;然后,针对综合表现最优模型,利用SHAP框架从特征变 量的重要性、主效应、作用方式以及交互效应等方面展开可解释性分析;最后,根据分析结果从患者、医生、平台三 个维度提出信息采纳优化策略。【结果/结论】问答时间差和回复文本总数是影响患者信息采纳最关键的两个因素, 此外,追问追答、悬赏金额、回答文本熵等因素对信息采纳行为的影响程度、影响方向以及影响方式也存在差异。 【创新/局限】利用算法归因思路对信息采纳行为的影响因素进行挖掘,但数据来源及形式较为单一,特征提取尚停 留在问答文本形式特征,未来将深度挖掘多源多模态问答数据中的内容特征,以完善相关影响因素。
