-
公开(公告)号:CN114372470A
公开(公告)日:2022-04-19
申请号:CN202210279342.6
申请日:2022-03-22
Applicant: 中南大学
Abstract: 本发明中提供了一种基于边界检测和提示学习的中文法律文本实体识别方法,属于数据处理技术领域,具体包括:文本编码模块输出文本向量;将文本向量输入实体边界检测模块,输出文本中实体的边界检测结果;基于构建好的法律文本语料库进行进一步的领域预训练,得到适用于法律领域的预训练模型;在实体类型预测模块中,基于提示学习思想,根据实体边界检测模块输出的结果构建适用于命名实体识别任务的模板,再利用模板和预训练模型进行提示学习,输出实体类型的预测结果;对实体边界检测模块和实体类型预测模块进行联合训练,得到适用于中文法律文本实体识别任务的模型。通过本发明的方案,提高了法律文本命名实体识别时的适应性和精准度。
-
公开(公告)号:CN114372470B
公开(公告)日:2022-07-29
申请号:CN202210279342.6
申请日:2022-03-22
Applicant: 中南大学
Abstract: 本发明中提供了一种基于边界检测和提示学习的中文法律文本实体识别方法,属于数据处理技术领域,具体包括:文本编码模块输出文本向量;将文本向量输入实体边界检测模块,输出文本中实体的边界检测结果;基于构建好的法律文本语料库进行进一步的领域预训练,得到适用于法律领域的预训练模型;在实体类型预测模块中,基于提示学习思想,根据实体边界检测模块输出的结果构建适用于命名实体识别任务的模板,再利用模板和预训练模型进行提示学习,输出实体类型的预测结果;对实体边界检测模块和实体类型预测模块进行联合训练,得到适用于中文法律文本实体识别任务的模型。通过本发明的方案,提高了法律文本命名实体识别时的适应性和精准度。
-