-
公开(公告)号:CN109145819A
公开(公告)日:2019-01-04
申请号:CN201810958615.3
申请日:2018-08-22
Applicant: 国网信通亿力科技有限责任公司 , 国网信息通信产业集团有限公司 , 国家电网有限公司
CPC classification number: G06K9/00442 , G06F17/2775 , G06K2209/01
Abstract: 本发明涉及一种一种基于OCR和可信结构化数据库的信息鉴别方法,包括:步骤S100,对信息载体(纸)的一个或多个影像进行OCR处理,获得信息载体的主索引内容CI、第一内容向量A=(a1,a2,...,am)和第二内容向量B=(b1,b2,...,bn),其中m和n分别为第一、二内容向量中元素的数量;步骤S200,在可信结构化数据库中使用主索引内容CI进行检索,并将检索获得结果记录中提取第一可信内容向量P=(p1,p2,...,pm)和第二可信内容向量Q=(q1,q2,...,qn);步骤S300,如果A=P,那么执行步骤S400;如果A≠P,那么向用户提示所述影像中呈现的内容为虚假内容;步骤S400,计算B和Q的相似度其中,bqi为bi和qi的相似度,如果SBQ≥D,那么判断所述影像中呈现的内容为真实内容;否则,向用户提示影像中呈现的内容为虚假内容。
-
公开(公告)号:CN109145819B
公开(公告)日:2022-02-11
申请号:CN201810958615.3
申请日:2018-08-22
Applicant: 国网信通亿力科技有限责任公司 , 国网信息通信产业集团有限公司 , 国家电网有限公司
IPC: G06V30/42 , G06V30/262 , G06F16/242
Abstract: 本发明涉及一种一种基于OCR和可信结构化数据库的信息鉴别方法,包括:步骤S100,对信息载体(纸)的一个或多个影像进行OCR处理,获得信息载体的主索引内容CI、第一内容向量A=(a1,a2,...,am)和第二内容向量B=(b1,b2,...,bn),其中m和n分别为第一、二内容向量中元素的数量;步骤S200,在可信结构化数据库中使用主索引内容CI进行检索,并将检索获得结果记录中提取第一可信内容向量P=(p1,p2,...,pm)和第二可信内容向量Q=(q1,q2,...,qn);步骤S300,如果A=P,那么执行步骤S400;如果A≠P,那么向用户提示所述影像中呈现的内容为虚假内容;步骤S400,计算B和Q的相似度其中,bqi为bi和qi的相似度,如果SBQ≥D,那么判断所述影像中呈现的内容为真实内容;否则,向用户提示影像中呈现的内容为虚假内容。
-