-
公开(公告)号:CN116108206B
公开(公告)日:2023-06-27
申请号:CN202310390977.8
申请日:2023-04-13
Applicant: 中南大学
IPC: G06F16/36 , G06F16/35 , G06F40/284 , G06F40/295 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本发明提供了一种金融数据实体关系的联合抽取方法及相关设备,包括:获取待处理金融文本的特征信息并进行分区过滤,得到输入特征向量和词向量;将输入特征向量和词向量均输入第一抽取模型,得到早期识别结果和早期分类结果;将输入特征向量、早期识别结果和早期分类结果均输入第一互信息模块得到实体信息流,将词向量、早期识别结果和早期分类结果输入第二互信息模块得到关系信息流;将实体信息流、关系信息流均输入第二抽取模型得到实体识别结果和关系分类结果,对识别分类结果进行解码,得到主体识别结果、客体识别结果以及主体与客体之间的关系并组成三元组形式,得到金融文本的实体关系抽取结果;提高了金融数据实体关系抽取的准确性。
-
公开(公告)号:CN116306606A
公开(公告)日:2023-06-23
申请号:CN202310316449.8
申请日:2023-03-27
Applicant: 中南大学
IPC: G06F40/258 , G06N3/0464 , G06N3/0442 , G06N3/084 , G06F40/211 , G06Q40/00
Abstract: 本发明公开一种基于增量学习的金融合同条款提取方法和系统,包括:获取条款数据,并对条款数据进行预处理及标准化;构造批量数据生成器,生成神经网络输入张量;基于一维CNN和双向LSTM网络搭建条款提取模型;将条款训练数据输入条款提取模型进行训练,对新数据进行增量训练;将条款测试数据送入已训练完成的条款提取模型中进行预测,获取段落的序列标注并提取得到预测的条款。本发明的优点是采用知识蒸馏的方式进行类增量学习,既能保留旧模型的预测效果,又能获得新类别的识别能力。同时利用CNN的速度和轻量特性与RNN的上下文信息获取特性,提高预测的速度和准确度。
-
公开(公告)号:CN116108206A
公开(公告)日:2023-05-12
申请号:CN202310390977.8
申请日:2023-04-13
Applicant: 中南大学
IPC: G06F16/36 , G06F16/35 , G06F40/284 , G06F40/295 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本发明提供了一种金融数据实体关系的联合抽取方法及相关设备,包括:获取待处理金融文本的特征信息并进行分区过滤,得到输入特征向量和词向量;将输入特征向量和词向量均输入第一抽取模型,得到早期识别结果和早期分类结果;将输入特征向量、早期识别结果和早期分类结果均输入第一互信息模块得到实体信息流,将词向量、早期识别结果和早期分类结果输入第二互信息模块得到关系信息流;将实体信息流、关系信息流均输入第二抽取模型得到实体识别结果和关系分类结果,对识别分类结果进行解码,得到主体识别结果、客体识别结果以及主体与客体之间的关系并组成三元组形式,得到金融文本的实体关系抽取结果;提高了金融数据实体关系抽取的准确性。
-
-