-
公开(公告)号:CN109409356A
公开(公告)日:2019-03-01
申请号:CN201810967087.8
申请日:2018-08-23
Applicant: 浙江理工大学
Abstract: 本发明提供了一种基于SWT的多方向中文印刷体文字检测方法,其首先通过二维离散傅里叶变换校正倾斜图像,然后通过水平投影直方图,快速提取首行文本区域,对于存在倾斜角度大的图像,提取文本前三行作为识别区域,避免了对整个文本的检测,提高了检测速度;同时本发明对提取完的文本行进行Canny边缘检测,最后基于改进的SWT算法,结合相关文本检测、过滤的启发式规则,检测图像是否是中文印刷体图像。由此可见,本发明通过基于改进的SWT算法,提取中文文本固有的笔画宽度特征,同时结合二维离散傅里叶变化以及设定的文本启发式规则,可以快速、准确的检测图像是否是中文印刷体图像,提高了OCR预处理阶段的文本识别检测效率。
-
公开(公告)号:CN109409356B
公开(公告)日:2021-01-08
申请号:CN201810967087.8
申请日:2018-08-23
Applicant: 浙江理工大学
Abstract: 本发明提供了一种基于SWT的多方向中文印刷体文字检测方法,其首先通过二维离散傅里叶变换校正倾斜图像,然后通过水平投影直方图,快速提取首行文本区域,对于存在倾斜角度大的图像,提取文本前三行作为识别区域,避免了对整个文本的检测,提高了检测速度;同时本发明对提取完的文本行进行Canny边缘检测,最后基于改进的SWT算法,结合相关文本检测、过滤的启发式规则,检测图像是否是中文印刷体图像。由此可见,本发明通过基于改进的SWT算法,提取中文文本固有的笔画宽度特征,同时结合二维离散傅里叶变化以及设定的文本启发式规则,可以快速、准确的检测图像是否是中文印刷体图像,提高了OCR预处理阶段的文本识别检测效率。
-