情报科学 ›› 2019, Vol. 37 ›› Issue (7): 41-47.

• 论文 • 上一篇    下一篇

领域无关学术文献词汇功能标准化数据集构建及分析

  

  • 出版日期:2019-07-01

  • Online:2019-07-01

摘要: 【目的/意义】构建一个较大规模的学术文献词汇功能标准化数据集,并对其进行描述分析,以期为学术检 索、文献推荐和科学计量等应用研究提供更加科学合理的数据支撑。【方法/过程】在学术文本词汇功能框架的基础 上,针对“研究问题”和“研究方法”这两种领域无关词汇功能,生成学术文献词汇功能自动标引规则模板,开发相应 的词汇功能标注平台,对88 865篇计算机领域文献进行自动标引,并对得到的数据集进行整体分析、热点和趋势分 析以及研究方法特点分析。【结果/结论】得到一个包含23 221个不重复研究问题的Topic数据集、18427个不重复研 究方法的Method数据集和30 145个“问题-方法”对的Topic-Method数据集;人工检验准确率高于95%。此外,文 章还创新性地提出了研究方法的 “功能特点”,并进行了相关实践。