一种结合大模型单类别标注的NER模型训练方法

    公开(公告)号:CN119761513A

    公开(公告)日:2025-04-04

    申请号:CN202411838546.4

    申请日:2024-12-13

    Abstract: 本发明公开了一种结合大模型单类别标注的NER模型训练方法,属于命名实体识别技术领域,在为如中医药、生物医疗、网络安全等的某些特定领域训练命名实体识别模型时,由于人工标注样本较少而导致训练得到的模型效果不佳;本发明可利用大模型单类别自动标注的结果提升该种情况下训练得到的命名实体识别模型的效果;大模型单类别自动标注结果可能有实体重叠现象,传统的模型构建和训练方法无法应对,因此本发明通过针对地设计模型结构和训练方法,使该种标注结果可以被充分利用。本发明通过大模型自动标注增大了可利用的训练数据量,且通过单类别预测的方式提高了自动标注质量,最终可以提升训练得到的命名实体识别模型的效果。

Patent Agency Ranking