-
公开(公告)号:CN118470731A
公开(公告)日:2024-08-09
申请号:CN202410522645.5
申请日:2024-04-28
Applicant: 北京中电普华信息技术有限公司 , 国网信息通信产业集团有限公司
IPC: G06V30/412 , G06V30/413 , G06V30/414 , G06V30/418
Abstract: 本申请实施例提供一种复杂表格信息智能提取方法及装置,包括:获取表格图像;从所述表格图像中提取表格框架,得到表格框架图像和各单元格的位置信息;根据所述位置信息,对所述表格图像进行裁剪,得到对应各单元格的单元格图像;对于每个单元格图像,利用预设的内容识别模型,从所述单元格图像中提取单元格内容;利用预设的内容分类模型,确定所述单元格内容的类型;基于各单元格的位置信息、单元格内容、类型,重塑表格信息,能够对结构复杂的表格进行处理,得到准确的表格信息。