一种基于概念交互和关联语义的文本视觉问答系统及方法

    公开(公告)号:CN111858882A

    公开(公告)日:2020-10-30

    申请号:CN202010584144.1

    申请日:2020-06-24

    Abstract: 本发明提供了一种基于概念交互和关联语义的文本视觉问答系统及方法,包括物体位置提取模块、第一全连接层、文本信息提取模块、第二全连接层、OCR-object图卷积网络、多门步机制图卷积网络、转换器网络以及双向转换器表征编码器BERT。本申请利用图像中物体和文本信息的位置关系建模,之后通过OCR-object图卷积网络对文本信息和物体信息建模,通过门机制对关系的编码学习到丰富且具有指向性的特征,最后通过转换器网络对图像当中的物体和文本进行精准关注,从而得到更加准确的答案。

Patent Agency Ranking