摘要: 【目的/意义】针对基于内容的推荐方法无法充分考虑论文之间或论文与作者之间复杂的隐含关系的问题, 充分考虑学术知识图蕴含的各种关系以及基于内容方法,将两种方法结合,互补各自的不足之处提出一种基于图 对比学习的跨领域文献信息表示方法(Graph Contrast Learning for Information Representation Method,GCLIRM), 旨在解决文献信息表示方法单一,信息表示不充分等问题。【方法/过程】该方法同时考虑异构图和同构图,异构图 网络首先使用重启随机游走算法得到节点序列,采用Skip-gram算法初始化节点表示,设计两级注意力机制用于节 点重要性和元路径重要性建模,以学习异构图节点表示;其次,由预训练大模型ERNIE3.0建模同构图节点特征,再 通过GAT聚合邻居信息并使用自编码器进行无监督训练;最后设计对比学习策略学习最终的节点特征,即文献信 息表示。【结果/结论】本文 GCLIRM 方法在学科分类和期刊分类两个下游任务中 F1值分别比次优解提升了 5.31% 和 2.49%,表示本文方法对跨领域文献信息的表示能力有较大的提升。【创新/局限】本文设计了一个提取文献信息 表示的混合方法,克服了单一方法表示不充分的难题,并且具有一定的可行性和准确性,为后续相关研究提供借鉴 思路。
