-
公开(公告)号:CN116431757B
公开(公告)日:2023-08-25
申请号:CN202310692938.3
申请日:2023-06-13
Applicant: 中国人民公安大学
IPC: G06F16/31 , G06F40/216 , G06F40/295 , G06F40/30 , G06N3/045 , G06N3/0455 , G06N3/0442 , G06N3/0464 , G06N3/047 , G06N3/048 , G06N3/091
Abstract: 本发明提供了一种基于主动学习的文本关系抽取方法、电子设备和存储介质,方法包括:获取任一训练样本d中的初始实体集S0d;获取S0di的关系类别概率集P0di;获取S0di对应的分类价值V0di=ln(P01di/(P02di+σ0di)),如果V0di>0,则赋予S0di第一标签,如果V0di<0,则赋予S0di第二标签;对具有标签的训练样本d中的冗余实体进行过滤处理,得到过滤处理后的训练样本d;基于过滤处理后的H个训练样本,对初始文本关系抽取模型进行训练,得到目标文本关系抽取模型;利用所述目标文本关系抽取模型对需要抽取实体关系的文本中的实体关系进行抽取。本发明能够提高文本关系抽取的效果。
-
公开(公告)号:CN116431757A
公开(公告)日:2023-07-14
申请号:CN202310692938.3
申请日:2023-06-13
Applicant: 中国人民公安大学
IPC: G06F16/31 , G06F40/216 , G06F40/295 , G06F40/30 , G06N3/045 , G06N3/0455 , G06N3/0442 , G06N3/0464 , G06N3/047 , G06N3/048 , G06N3/091
Abstract: 本发明提供了一种基于主动学习的文本关系抽取方法、电子设备和存储介质,方法包括:获取任一训练样本d中的初始实体集S0d;获取S0di的关系类别概率集P0di;获取S0di对应的分类价值V0di=ln(P01di/(P02di+σ0di)),如果V0di>0,则赋予S0di第一标签,如果V0di<0,则赋予S0di第二标签;对具有标签的训练样本d中的冗余实体进行过滤处理,得到过滤处理后的训练样本d;基于过滤处理后的H个训练样本,对初始文本关系抽取模型进行训练,得到目标文本关系抽取模型;利用所述目标文本关系抽取模型对需要抽取实体关系的文本中的实体关系进行抽取。本发明能够提高文本关系抽取的效果。
-