情报科学 ›› 2019, Vol. 37 ›› Issue (11): 38-42.

• 理论研究 • 上一篇    下一篇

基于加权Word2vec的文本分类方法研究

  

  • 出版日期:2019-11-01

  • Online:2019-11-01

摘要: 【目的/意义】利用词向量的优点,提出一种加权Word2vec的文本分类方法,以期在文本分类时获得较高的
分类效果。【方法/过程】首先对文本进行词向量训练,通过设置词语相似度阈值,将文本关键词划分为重叠部分和非
重叠部分,随后分别计算两部分加权相似度值,再采用参数化线性加权方式计算文本相似度,最后采用KNN进行
分类。【结果/结论】实验结果表明文中提出的加权Word2vec方法比TF-IDF传统文本分类模型和均值Word2vec模
型的分类效果有所提升,是一种有效的文本分类方法。