-
公开(公告)号:CN117218667A
公开(公告)日:2023-12-12
申请号:CN202311464573.5
申请日:2023-11-07
Applicant: 华侨大学
Abstract: 本发明提供了一种基于字根的中文文字识别方法及系统,涉及文字识别技术领域,构建常用字字根集;获取包括有待识别汉字的待识别汉字图像;将待识别汉字图像输入到汉字识别模型中,识别待识别汉字图像中存在的字根,并根据待识别汉字图像中存在的字根与常用字字根集确定待识别汉字;本发明基于MAML算法以及ACE算法构建训练得到汉字识别模型,相较于传统的基于字根配合制定结构标签策略的方法,本发明所提出的方法可以减少一些复杂的处理步骤的同时,保证模型识别的准确率,使得模型具备了小样本学习以及不需要汉字结构标签便可准确识别的能力,并达到了高效识别且端化的目的。
-
-
公开(公告)号:CN116343249A
公开(公告)日:2023-06-27
申请号:CN202310300980.6
申请日:2023-03-27
Applicant: 华侨大学 , 河南高辉教育科技有限公司
IPC: G06V30/413 , G06V10/82 , G06V30/146 , G06V30/414
Abstract: 本发明公开一种表格识别方法及系统,涉及表格识别技术领域,获取对待识别表格进行拍摄所得到的图片,利用文字检测模型对图片进行识别,确定图片中的文本区域,利用文字识别模型对文本区域进行文字识别,得到文本识别结果,文本识别结果包括文本区域内每个元素的顶点坐标及文本内容,通过先识别文本区域再进行文字识别的方式能够快速确定待识别表格的文本内容。根据文本识别结果对文本区域内每个元素进行位置定位,确定文本区域内每个元素的位置,从而可以得到待识别表格中各个元素的位置及文本内容,准确、高效的对表格内容进行识别。
-
-