摘要:
【目的/意义】在专利诉讼发生之前,对容易引发诉讼的高风险专利进行识别具有重要的意义,有助于我国
相关主体及早采取防控措施,规避专利风险。【方法/过程】从美国专利商标局公布的授权专利中采集诉讼专利数据
和非诉讼专利数据作为研究对象,融合专利申请、专利审查和专利价值等多维特征,利用机器学习技术构建潜在诉
讼风险专利的识别模型,并进行模型性能评估与对比。【结果/结论】研究表明,基于随机森林的潜在诉讼风险专利
识别模型在召回率、准确率和综合性能方面表现最优,可以有效识别出潜在诉讼风险专利,更加适用于专利风险预
警及防控活动中。与基于单分类器的潜在诉讼风险专利识别模型相比,基于集成学习的识别模型在潜在诉讼风险
专利识别过程中尚未表现出明显的优势。【创新/局限】本文在专利数据采集、关键特征筛选和核心算法选择方面规
避了已有研究的不足,同时提供了机器学习技术在潜在诉讼风险专利识别领域的初步尝试,进一步丰富了潜在诉
讼风险专利识别的理论与方法。