情报科学 ›› 2018, Vol. 36 ›› Issue (1): 118-123.

• 论文 • 上一篇    下一篇

基于优化随机游走模型的文本热点主题探测研究

  

  • 出版日期:2018-01-05

  • Online:2018-01-05

摘要: 【目的/意义】结合随机游走算法PageRank、词共现和多样性测度指标提出一种改进的热点主题探测方法 C_BI-PageRank,该方法有效提高了热点主题探测的效率和模型质量。【方法/过程】首先对PageRank 算法进行理论 回顾,引入词共现和布里渊系数构建C_BI-PageRank 算法模型,然后采用4 种不同因素组合的PageRank 算法对 Web of Science 系统2006-2016 的应用心理学领域的期刊文献进行实证分析,最后基于波达计数的专家方法进行算 法比较与评价,同时也探索其与词频统计之间的相关性问题。【结果/结论】实证表明C_BI-PageRank不仅在运行效 率上收敛快、运行时间少且质量评估优势明显。该方法引入不同文本主题因素,一定程度解决传统词频分析和机 器学习的不足,为热点主题探测方法提供了新思路。