情报科学 ›› 2018, Vol. 36 ›› Issue (4): 45-50.

• 论文 • 上一篇    下一篇

基于词项热度的微博热点话题发现研究

  

  • 出版日期:2018-04-05

  • Online:2018-04-05

摘要: 【目的/意义】随着网民规模的扩大以及微博数据的增长,获取微博空间的热点话题是一项有价值的任务。 本文结合微博的特点提出专门针对中文微博的热点话题发现模型。【过程/方法】本文提出利用词项H指数筛选出 热点词项,然后利用BTM建模和VSM建模的结果相融合计算文本相似度,再利用k-means 聚类算法发现微博的热 点话题。【结果/结论】本文在提取特征阶段既考虑了微博词项的热度又考虑了其短文本性,通过实验验证本文提出 的方法有利于发现准确的热点话题。