-
公开(公告)号:CN109858037A
公开(公告)日:2019-06-07
申请号:CN201910145824.0
申请日:2019-02-27
Applicant: 华侨大学
Abstract: 本发明公开了一种对OCR识别结果进行结构化输出的方法及系统,方法包括:使用OCR对获取的身份证图像进行识别,对识别结果进行处理获得文本序列;通过训练好的命名实体模型对所述文本序列进行命名实体识别,获得带标签的命名实体数据,输出对应的结构化文本。本发明一种对OCR识别结果进行结构化输出的方法及系统,通过生成的大量的带标签的文本,训练得到命名实体识别模型,能够快速、高效地提取出OCR识别结果中的各个实体,得到结构化的输出,对身份信息的录入带来极大帮助。