图像文字行检测方法及装置
    1.
    发明公开

    公开(公告)号:CN115311667A

    公开(公告)日:2022-11-08

    申请号:CN202210922795.6

    申请日:2022-08-02

    Abstract: 本发明提供一种图像文字行检测方法及装置,该方法包括:获取待检测票据图像;将票据图像输入训练后的文字行检测模型,经特征提取网络提取特征后,分别输入首次打印分支和二次打印分支,并分别输出首次打印文本与背景的分类结果,和二次打印文本与背景的分类结果;其中,首次打印分支和二次打印分支从输入到输出方向的顺序均依次包括卷积层、特征融合层和反卷积层;首次打印分支和二次打印分支的特征融合层,均用于融合首次打印分支卷积层和二次打印分支卷积层处理的特征图,并分别输入所属分支的反卷积层。该方法通过特征融合以及两次打印文字行的分类,实现首次打印和二次打印文本信息的准确判断,提高两次打印信息识别后的关键信息抽取准确度。

    体表动态多光谱吸收特征参数的测量方法、装置及系统

    公开(公告)号:CN111012308B

    公开(公告)日:2021-06-01

    申请号:CN201911214325.9

    申请日:2019-12-02

    Applicant: 清华大学

    Abstract: 本发明实施例提供一种体表动态多光谱吸收特征参数的测量方法、装置及系统,该方法包括:获取入射到被测体的体表上,并经被测体传输后第一位置点的第一出射光信号以及第二位置点的第二出射光信号,并分别按照光谱特性分解为预设的多种窄带基础光信号;获取每种窄带基础光信号对应于两位置点构成的位置区间的吸光度信号,从而得到用于表征体表动态多光谱吸收特征的第一特征参数。本发明实施例提供的体表动态多光谱吸收特征参数的测量方法、装置及系统,通过将第一出射光信号和第二出射光信号分解为预设的多种窄带基础光信号,并获取每种窄带基础光信号对应于两位置点构成的位置区间的吸光度信号,实现了体表动态多光谱吸收特征参数的获取。

    体表动态多光谱吸收特征参数的测量方法、装置及系统

    公开(公告)号:CN111012308A

    公开(公告)日:2020-04-17

    申请号:CN201911214325.9

    申请日:2019-12-02

    Applicant: 清华大学

    Abstract: 本发明实施例提供一种体表动态多光谱吸收特征参数的测量方法、装置及系统,该方法包括:获取入射到被测体的体表上,并经被测体传输后第一位置点的第一出射光信号以及第二位置点的第二出射光信号,并分别按照光谱特性分解为预设的多种窄带基础光信号;获取每种窄带基础光信号对应于两位置点构成的位置区间的吸光度信号,从而得到用于表征体表动态多光谱吸收特征的第一特征参数。本发明实施例提供的体表动态多光谱吸收特征参数的测量方法、装置及系统,通过将第一出射光信号和第二出射光信号分解为预设的多种窄带基础光信号,并获取每种窄带基础光信号对应于两位置点构成的位置区间的吸光度信号,实现了体表动态多光谱吸收特征参数的获取。

    表格检测方法、表格检测模型训练方法及装置

    公开(公告)号:CN114399780B

    公开(公告)日:2024-09-27

    申请号:CN202111463289.7

    申请日:2021-12-02

    Abstract: 本发明提供一种表格检测方法、表格检测模型训练方法及装置,该方法包括:将待检测表格图像输入训练后的检测模型,得到表格预测分割图;根据表格预测分割图,确定表格预测框的位置信息;其中,检测模型训练过程为:将已知表格线和背景的训练样本,输入检测模型主干网络,得到表格预测分割图;根据分割图,分别基于表格线分类结果计算第一损失值,基于单元格回归结果计算第二损失值,基于表格对齐特征计算第三损失值;根据综合损失值对检测模型进行参数更新。该方法不仅考虑了表格分割任务的全局特征,同时得到了单元格回归及单元格对齐任务的局部信息,即综合考虑了表格的整体特征,其损失值计算更客观,从而模型在进行表格检测时的准确度较高。

    基于物体检测网络的英文字符切分方法及装置

    公开(公告)号:CN108921152B

    公开(公告)日:2020-11-06

    申请号:CN201810701151.8

    申请日:2018-06-29

    Applicant: 清华大学

    Abstract: 本发明实施例公开一种基于物体检测网络的英文字符切分方法及装置,能提高图片中英文字符切分的准确度。方法包括:S1、获取待切分的图片,从所述待切分的图片中提取出英文文本行区域;S2、将所述英文文本行区域输入预先训练得到的物体检测网络,得到所述待切分的图片的英文字符的切分结果,其中,所述物体检测网络在训练时使用的训练样本包括缩进粘连样本、蔓延粘连样本、视角粘连样本和特效粘连样本。

    基于物体检测网络的英文字符切分方法及装置

    公开(公告)号:CN108921152A

    公开(公告)日:2018-11-30

    申请号:CN201810701151.8

    申请日:2018-06-29

    Applicant: 清华大学

    Abstract: 本发明实施例公开一种基于物体检测网络的英文字符切分方法及装置,能提高图片中英文字符切分的准确度。方法包括:S1、获取待切分的图片,从所述待切分的图片中提取出英文文本行区域;S2、将所述英文文本行区域输入预先训练得到的物体检测网络,得到所述待切分的图片的英文字符的切分结果,其中,所述物体检测网络在训练时使用的训练样本包括缩进粘连样本、蔓延粘连样本、视角粘连样本和特效粘连样本。

    表格检测方法、表格检测模型训练方法及装置

    公开(公告)号:CN114399780A

    公开(公告)日:2022-04-26

    申请号:CN202111463289.7

    申请日:2021-12-02

    Abstract: 本发明提供一种表格检测方法、表格检测模型训练方法及装置,该方法包括:将待检测表格图像输入训练后的检测模型,得到表格预测分割图;根据表格预测分割图,确定表格预测框的位置信息;其中,检测模型训练过程为:将已知表格线和背景的训练样本,输入检测模型主干网络,得到表格预测分割图;根据分割图,分别基于表格线分类结果计算第一损失值,基于单元格回归结果计算第二损失值,基于表格对齐特征计算第三损失值;根据综合损失值对检测模型进行参数更新。该方法不仅考虑了表格分割任务的全局特征,同时得到了单元格回归及单元格对齐任务的局部信息,即综合考虑了表格的整体特征,其损失值计算更客观,从而模型在进行表格检测时的准确度较高。

    用于文档图像识别的关键信息抽取方法及装置

    公开(公告)号:CN115273118A

    公开(公告)日:2022-11-01

    申请号:CN202210723901.8

    申请日:2022-06-23

    Abstract: 本发明提供一种用于文档图像识别的关键信息抽取方法及装置,该方法包括:基于OCR识别结果,对每个键确定预设数量的候选键值;根据每个键选取对应的候选键值的评分,确定所有键选取候选键值的候选路径总评分;在所述候选路径总评分最高的情况下,确定每个键选取的目标键值,以得到对应的信息抽取结果;其中,每个键选取对应的候选键值时的评分,至少包括键与候选键值的位置关系确定的评分值。该方法有效避免了类似基于规则的信息抽取方法中固定关键词带来的易出错问题。同时,该方法综合考虑所有候选键值选取情况,有效利用了关键信息之间的相互联系以及互斥性,从而具有较高的准确率,可解决相似实体信息抽取的全局优化问题。

Patent Agency Ranking