情报科学 ›› 2017, Vol. 35 ›› Issue (10): 142-146.

• 论文 • 上一篇    下一篇

一种基于时间序列的热点话题发现模型和算法

  

  • 出版日期:2017-11-05

  • Online:2017-11-05

摘要: 【目的/意义】网络舆情的热点话题对政府和网民有着很大的影响,及时发现热点话题有利于政府监控话题 的发展。【方法/过程】本文提出了基于时间序列的话题动态演化两层模型,并将新闻网页内容的相似度和页面链接 分析作为话题热度的计算依据,然后利用改进的Single-Pass算法进行增量聚类获得聚类中心,最后根据热度权重将 聚类中心进行排序,获得热点话题。【结果/结论】通过实验验证,该算法发现效果好,能够更好地获得热点话题。