-
公开(公告)号:CN119919953A
公开(公告)日:2025-05-02
申请号:CN202510415351.7
申请日:2025-04-03
Applicant: 浙江华东工程数字技术有限公司 , 中国电建集团华东勘测设计研究院有限公司
IPC: G06V30/412 , G06V30/418 , G06V30/19 , G06V30/18 , G06V30/14 , G06V30/148 , G06V10/82 , G06F40/174
Abstract: 本发明提供了一种纸质水文年鉴表格结构化识别方法,包括如下步骤:获取纸质水文年鉴的扫描文件并转换为图片文件;获取每张转换后的图片文件中的表格图像及其属性信息;对获取的表格图像进行图像预处理、校正和超分辨率转换;对转换后的表格图像进行直线检测,生成表格单元格;对生成的表格单元格进行合并单元格及多层嵌套结构的识别;识别表格图像中的文字,获取每个文字区域的边界框,并将获取的文字区域的边界框与其最近邻的单元格进行匹配;将文字匹配后的单元格的坐标转换成行列序号,映射至Excel表格形式,并将文字识别结果填充至Excel表格单元格中;对填充后的Excel表格进行通用校验和水文年鉴数据合规性校验,并于校验通过后作为最终识别结果。