-
公开(公告)号:CN115935134A
公开(公告)日:2023-04-07
申请号:CN202211493252.3
申请日:2022-11-25
Applicant: 长城计算机软件与系统有限公司
Abstract: 本发明涉及用于统计出版物的数据处理设备、方法、装置和系统,该设备包括:统计出版物报表结构识别装置,对获取到的统计出版物图像中报表进行结构识别,并转化为可编辑的报表文件;报表单元格类别识别装置,识别所述报表文件中单元格内容所属的元数据类型进行识别;结构化数据存储装置,根据报表文件中单元格内容、单元格的类型、所述统计出版物图像中报表的结构,将报表中内容转化为结构化数据进行存储。本发明的方案能够智能提取宏观统计数据,在充分理解宏观统计数据含义的基础上,智能识别宏观数据的元数据信息,将宏观数据转化为结构化信息进行存储。