基于加权Word2vec的文本分类方法研究

情报科学 ›› 2019, Vol. 37 ›› Issue (11): 38-42.

基于加权Word2vec的文本分类方法研究

出版日期:2019-11-01

Online:2019-11-01

摘要/Abstract

摘要： 【目的/意义】利用词向量的优点，提出一种加权Word2vec的文本分类方法，以期在文本分类时获得较高的
分类效果。【方法/过程】首先对文本进行词向量训练，通过设置词语相似度阈值，将文本关键词划分为重叠部分和非
重叠部分，随后分别计算两部分加权相似度值，再采用参数化线性加权方式计算文本相似度，最后采用KNN进行
分类。【结果/结论】实验结果表明文中提出的加权Word2vec方法比TF-IDF传统文本分类模型和均值Word2vec模
型的分类效果有所提升，是一种有效的文本分类方法。

马思丹，刘东苏. 基于加权Word2vec的文本分类方法研究[J]. 情报科学, 2019, 37(11): 38-42.

基于加权Word2vec的文本分类方法研究

可视化

点击数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 0

编辑推荐

Metrics

本文评价