-
公开(公告)号:CN113298952A
公开(公告)日:2021-08-24
申请号:CN202110652559.2
申请日:2021-06-11
Applicant: 哈尔滨工程大学
Abstract: 本发明属于三维计算机视觉领域,具体涉及到一种基于数据扩容与相似性度量的面向残缺点云分类网络。本发明要解决的问题是如何将将完整的点云分类网络扩展到残缺点云,从而为面向残缺点云的分类问题提供优秀的解决方案。为此本发明在传统的基于点的分类网络的基础上,针对残缺点云提出了一种新的分类网络IPC‑Net,可以基于数据扩容及相似性度量解决残缺点云分类精度低及网络鲁棒性差的问题,此外利用辅助损失函数结合注意力机制帮助解决相关问题。
-
公开(公告)号:CN113240046B
公开(公告)日:2023-01-03
申请号:CN202110611831.2
申请日:2021-06-02
Applicant: 哈尔滨工程大学
IPC: G06V10/80 , G06V10/764 , G06V10/82 , G06F16/583 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明涉及计算机视觉和自然语言处理领域,具体涉及的是一种基于知识的视觉问答任务下的多模态信息融合方法。本发明将外部知识作为一个单独的模态,拓展了基于知识的视觉问答的思路;使用纯正的注意力方法将自然语言问题、图像和三元组形式的知识这三个模态进行深层的融合,为基于知识的视觉问答任务提供了新颖有效地解决方案,本发明提出的多模态融合技术不局限于基于知识的视觉问答任务,可以将其扩展到其他多模态任务当中去;使用新颖有效地位置编码方法为图像的位置进行编码,比传统方法中不利用图像位置信息或者使用图像区域坐标作为位置信息,本发明中的位置编码更加有效,可以高效的解决基于知识的视觉问答任务中跟图像位置相关的问题。
-
公开(公告)号:CN113240046A
公开(公告)日:2021-08-10
申请号:CN202110611831.2
申请日:2021-06-02
Applicant: 哈尔滨工程大学
IPC: G06K9/62 , G06F16/583 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明涉及计算机视觉和自然语言处理领域,具体涉及的是一种基于知识的视觉问答任务下的多模态信息融合方法。本发明将外部知识作为一个单独的模态,拓展了基于知识的视觉问答的思路;使用纯正的注意力方法将自然语言问题、图像和三元组形式的知识这三个模态进行深层的融合,为基于知识的视觉问答任务提供了新颖有效地解决方案,本发明提出的多模态融合技术不局限于基于知识的视觉问答任务,可以将其扩展到其他多模态任务当中去;使用新颖有效地位置编码方法为图像的位置进行编码,比传统方法中不利用图像位置信息或者使用图像区域坐标作为位置信息,本发明中的位置编码更加有效,可以高效的解决基于知识的视觉问答任务中跟图像位置相关的问题。
-
公开(公告)号:CN113298952B
公开(公告)日:2022-07-15
申请号:CN202110652559.2
申请日:2021-06-11
Applicant: 哈尔滨工程大学
Abstract: 本发明属于三维计算机视觉领域,具体涉及到一种基于数据扩容与相似性度量的面向残缺点云分类网络。本发明要解决的问题是如何将将完整的点云分类网络扩展到残缺点云,从而为面向残缺点云的分类问题提供优秀的解决方案。为此本发明在传统的基于点的分类网络的基础上,针对残缺点云提出了一种新的分类网络IPC‑Net,可以基于数据扩容及相似性度量解决残缺点云分类精度低及网络鲁棒性差的问题,此外利用辅助损失函数结合注意力机制帮助解决相关问题。
-
-
-