一种医疗命名实体识别方法、装置及存储介质

    公开(公告)号:CN117313732B

    公开(公告)日:2024-03-26

    申请号:CN202311608482.4

    申请日:2023-11-29

    Abstract: 本发明公开了一种医疗命名实体识别方法、装置及存储介质,属于自然语言处理技术领域,其包括:利用现有医疗文本训练得到命名实体识别模型,将待识别医疗文本输入命名实体识别模型,完成实体的提取,该模型的获取包括:对教师模型进行医疗领域的初始化训练,通过训练后的教师模型得到未标记字的伪标签,通过标签选择策略对所述伪标签进行选择,通过正伪标签、负伪标签及其对应的标记数据分别对学生模型进行训练,得到命名实体识别模型,利用医疗领域少量标记数据完成了命名实体识别任务,减少了人工成本,不仅通过标签选择减少了噪声标签进入模型,还通过性能评价指标的衡量获取了性能最优的模型,提升了命名实体识别的效果。

    一种基于半监督学习的糖尿病命名实体识别模型构建方法

    公开(公告)号:CN116151260A

    公开(公告)日:2023-05-23

    申请号:CN202310189507.5

    申请日:2023-02-28

    Abstract: 本发明公开了一种基于半监督学习的糖尿病命名实体识别模型构建方法,其网络结构包括两个模块,一个模块是命名实体识别(NER)模块,包括BERT嵌入层、BERT模型、CRF模型和生成对抗训练。其中,BERT嵌入层加和三个向量作为BERT模型的输入;BERT模型对输入字符上下文信息进行捕获,学习语义特征;CRF模型提取标签间的约束关系,计算最优标签序列;生成对抗训练通过对已标注样本和未标注样本的潜在变量分布之间的训练,优化命名实体识别模型。另一个模块是半监督学习模块,通过迭代训练优化模型。本发明的命名实体识别模型能充分利用未标注样本,优化命名实体识别模型,并在少量标注样本的情况下,达到良好的命名实体识别效果。

    一种医疗命名实体识别方法、装置及存储介质

    公开(公告)号:CN117313732A

    公开(公告)日:2023-12-29

    申请号:CN202311608482.4

    申请日:2023-11-29

    Abstract: 本发明公开了一种医疗命名实体识别方法、装置及存储介质,属于自然语言处理技术领域,其包括:利用现有医疗文本训练得到命名实体识别模型,将待识别医疗文本输入命名实体识别模型,完成实体的提取,该模型的获取包括:对教师模型进行医疗领域的初始化训练,通过训练后的教师模型得到未标记字的伪标签,通过标签选择策略对所述伪标签进行选择,通过正伪标签、负伪标签及其对应的标记数据分别对学生模型进行训练,得到命名实体识别模型,利用医疗领域少量标记数据完成了命名实体识别任务,减少了人工成本,不仅通过标签选择减少了噪声标签进入模型,还通过性能评价指标的衡量获取了性能最优的模型,提升了命名实体识别的效果。

Patent Agency Ranking