摘要:
【目的/意义】用户对健康信息的需求存在一定的差异,并形成不同的兴趣群体,对用户兴趣群体的发现以
及组成机构的分析,有助于探索在线健康社区中知识转移与扩散的相关规律。【方法/过程】本研究借助ATM模型,
通过文本聚类识别用户偏好主题,引入用户映射表和海林格距离算法,对用户兴趣群进行识别,并其分布结构和偏
好主题内容进行了分析;同时,将医享网作为案例进行研究,进一步识别和分析健康社区的用户兴趣群及其相关特
征。【结果/结论】采用本研究框架识别出来医享网痛风社区可分为保健、症状与治疗三个偏好主题;在此基础上结
合用户兴趣群体结构分析和偏好主题具体内容,发现不同兴趣群体规模有所差别,组成结构具有一定的交叉性,并
在一定程度上根据疾病发展的阶段性特征,存在动态迁移性。【创新/局限】基于主题-用户映射关系,对在线健康社
区中偏好相似用户群和主题偏好分布规律进行探索,今后可进一步完善模型对不均衡文本的处理能力。