-
公开(公告)号:CN110909226B
公开(公告)日:2023-06-06
申请号:CN201911194180.0
申请日:2019-11-28
Applicant: 达而观信息科技(上海)有限公司
IPC: G06F16/11 , G06F16/16 , G06F16/172 , G06F40/232 , G06Q40/00
Abstract: 本发明实施例公开了一种金融类文档信息处理方法、装置、电子设备及存储介质,其中,该方法包括:将待审核的金融类文档,通过文档处理模块生成文档结构化数据;基于文档结构化数据生成财务科目结构化数据;将文档结构化数据输入到文字纠错模型中,输出纠错结果;将文档结构化数据输入到管理人员信息抽检校验模块,生成管理人员信息的校验结果;将财务科目结构化数据分别输入到财务指标公式计算模块、财务科目变化校验模块和财务报表抽取校验模块;分别生成财务指标公式的校验结果、财务科目变化的校验结果以及财务科目数据与对应基准数据的校验结果;将所有的校验结果以及纠错结果进行展示。本发明实施例提供的技术方案可以提高金融类文档审核的效率。
-
公开(公告)号:CN110489760A
公开(公告)日:2019-11-22
申请号:CN201910873397.8
申请日:2019-09-17
Applicant: 达而观信息科技(上海)有限公司
Abstract: 本申请公开了一种基于深度神经网络文本自动校对方法及装置,方法通过获取语料,并对语料进行分词,得到若干第一词组;根据每个第一词组的易混淆词,自动生成每个第一词组的混淆集;获取训练集,并通过训练集对N-gram模型进行训练和对BiLSTM-CRF模型进行训练;接收第一文本,并对第一文本进行预处理得到第二文本;通过训练后的N-gram模型和BiLSTM-CRF模型以及混淆集对第二文本进行文本查错和文本纠错。达到了自动生成基于音似词、形似词和同义词的混淆集的目的,从而实现了基于混淆集和BiLSTM-CRF模型的方法既引入上下文词向量对目标词进行校对,又通过混淆集对方法进行一些限制的效果;且结合N-gram模型和BiLSTM-CRF模型进行校对,比单一模型校对效果都好。
-
公开(公告)号:CN113627193A
公开(公告)日:2021-11-09
申请号:CN202110926242.3
申请日:2021-08-12
Applicant: 达而观信息科技(上海)有限公司
IPC: G06F40/30 , G06F40/289
Abstract: 本发明实施例公开了一种中文文本中指代关系的确定方法、装置、设备及介质。该方法包括:获取目标中文文本,目标中文文本中包括待确定指代关系的目标名词和目标代词;将目标中文文本输入至预训练的,基于注意力机制的语义模型中,获取语义模型针对所述目标中文文本形成的至少一个注意力矩阵;根据各注意力矩阵,获取目标名词和目标代词之间的注意力指标,并根据注意力指标,确定目标代词和目标名词之间是否存在指代关系。通过本发明实施例的技术方案,能够直接对输入的目标中文文本数据进行预测,判断目标名词和目标代词间是否存在指代关系,不需要构建复杂的训练样本,也无需训练复杂的指代关系确定模型,提高了指代关系的判断效率。
-
公开(公告)号:CN110909226A
公开(公告)日:2020-03-24
申请号:CN201911194180.0
申请日:2019-11-28
Applicant: 达而观信息科技(上海)有限公司
Abstract: 本发明实施例公开了一种金融类文档信息处理方法、装置、电子设备及存储介质,其中,该方法包括:将待审核的金融类文档,通过文档处理模块生成文档结构化数据;基于文档结构化数据生成财务科目结构化数据;将文档结构化数据输入到文字纠错模型中,输出纠错结果;将文档结构化数据输入到管理人员信息抽检校验模块,生成管理人员信息的校验结果;将财务科目结构化数据分别输入到财务指标公式计算模块、财务科目变化校验模块和财务报表抽取校验模块;分别生成财务指标公式的校验结果、财务科目变化的校验结果以及财务科目数据与对应基准数据的校验结果;将所有的校验结果以及纠错结果进行展示。本发明实施例提供的技术方案可以提高金融类文档审核的效率。
-
-
-