面向题库建设的高效文档版面分析方法、系统、设备及介质

    公开(公告)号:CN119992579A

    公开(公告)日:2025-05-13

    申请号:CN202510113074.4

    申请日:2025-01-23

    Abstract: 本发明公开了一种面向题库建设的高效文档版面分析方法、系统、设备及介质,适用于题库建设,分析方法步骤如下:扫描不同学科试卷、教材配套习题、书籍的文档图像,并预处理得到无倾斜的扫描文档图像;标注扫描文档图像中各元素的相对位置和类别标签得到文档数据集;采用文档数据集对文档版面目标检测模型进行训练;将待检测的图像输入到经过训练的文档版面目标检测模型中,检测包括题目、图形和表格在内的前景内容,并输出版面元素的识别结果。本发明在提升前景内容检测精度的同时,提高了文档版面目标检测模型的推理速度,实现了对不同学科试卷和教材习题中的各类元素的准确识别,为题库建设等应用提供了高效的解决方案。

Patent Agency Ranking