摘要: 【 目的/意义】在线健康社区含有大量、繁杂的问诊文本,采用多类文本语义表示方法充分获取文本的语义 信息,以精准识别其中的命名实体。【方法/过程】首先,分别使用Word2vec和GloVe静态词嵌入模型对问诊文本进 行训练获得局部与全局静态语义表示,进而融合为静态语义表示。其次,利用医疗健康领域的ERNIE-Health动态 词嵌入模型生成动态语义表示。最后,将静态和动态语义表示融合后输入BiLSTM-CRF,识别出问诊文本中的实 体。【结果/结论】相较于单一的静态和动态语义表示,语义表示融合后的问诊文本命名实体识别效果在准确率、召 回率和F1值分别提升了2.17%、4.07%和3.12%以及0.60%、3.18%和1.89%。【创新/局限】综合考虑问诊文本中的静态 与动态语义表示,提升问诊文本命名实体识别效果。但仍存在含义相同但名称不同的实体,一定程度上影响实体 质量。