摘要:
【目的/意义】命名实体识别(NER)作为医疗记录处理的核心组成部分,对于提高电子病历处理的准确性
和效率至关重要。尤其是在处理中文病历这一领域,由于中文的复杂性,NER任务面临更多挑战。因此,开发一种
有效的中文病历命名实体识别模型,对于改进医疗记录的信息提取和数据处理流程具有重要价值。【方法/过程】文
中提出了一个新型框架 NER-CMR(中文病历命名实体识别),旨在克服现有 NER 方法在中文病历中的限制。
NER-CMR 框架通过结合流行的连续词和短语等上下文信息,解决传统 NER 中实体词嵌套和边界识别的问题。
具体来说,该框架从相关词和短语中提取字符间的邻接、共现和依赖关系,这些信息随后被融合到 NER 神经模型
中。NER-CMR 包含字符编码模块、词嵌入模块、图形构建模块、融合模块和 CRF 模块。【结果/结论】通过在
CCKS这个广泛使用的中文病历数据集与DIABETES真实糖尿病中文数据集上进行综合实验,NER-CMR展示了
其在识别性能上优于基线模型的能力。此外,该模型作为一个引入图神经网络的中文NER任务处理框架,具有模
块替换的灵活性,为中文电子病历命名实体识别研究领域提供了新的发展方向。【创新/局限】提出了基于图注意力
机制的网络图,设计了融合层实现多图融合处理,进一步利用两种策略来应对不正确关系带来的噪音问题,但缺乏
智慧医疗系统应用层面的实例研究。