情报科学 ›› 2020, Vol. 38 ›› Issue (9): 90-95.

• 业务研究 • 上一篇    下一篇

 
共词分析中高频词阈值确定方法的实证研究
——以新冠肺炎文献高频词选取为例

  

  • 出版日期:2020-09-01

  • Online:2020-09-01

摘要:  

【目的/意义】高频词选取是共词分析中重要一环,高频词阈值选取结果会直接影响共词分析的效果。目前
图书情报领域研究人员做共词分析时主要有自主确定法、高低频词分界公式法、普赖斯公式法等。笔者以词频g指
数为基础构建了一种确定高频词阈值的方法,对上述高频词阈值确定方法进行实证研究,探究了不同高频词阈
值确定方法选词的实际效果。【方法/过程】本文以中国知网中收录的新型冠状病毒肺炎主题论文为数据来源,利
用不同高频词阈值确定方法选取对应高频词。利用excel统计数据并构造共词矩阵,借助spss软件对矩阵进行聚
类分析。【结果/结论】笔者发现基于词频g指数的方法取得了良好的共词聚类效果,为该方法的实际应用做了有
益的尝试。