一种基于单目图像的开放世界三维场景重建及感知方法

    公开(公告)号:CN117475105A

    公开(公告)日:2024-01-30

    申请号:CN202310556250.2

    申请日:2023-05-17

    Applicant: 厦门大学

    Abstract: 一种基于单目图像的开放世界三维场景重建及感知方法,涉及计算机视觉。包括场景感知、场景解耦、实例处理、实例重建、场景重组、场景感知信息融合。首先利用预训练感知模型对单目图像进行感知与实例分割;再通过填充等处理进行实例去遮挡,并再次进行实例感知得到其语义信息;再利用实例语义信息进行单目三维重建;最后通过场景和实例的感知信息计算得各实例在场景中的三维位置,并将实例重组为原始图像对应的三维场景,并通过重建出的实例三维模型计算场景中各实例的三维感知信息。有效处理开放世界场景中的实例数量不一、实例遮挡等问题,提高开放世界三维场景重建及感知的鲁棒性。

    一种由文本生成3D场景的方法、系统、介质及程序产品

    公开(公告)号:CN119027576A

    公开(公告)日:2024-11-26

    申请号:CN202410867945.7

    申请日:2024-07-01

    Applicant: 厦门大学

    Abstract: 本发明涉及一种由文本生成3D场景的方法,其首先使用一个轨迹扩散变换器作为摄影指导,根据文本描述来建模相机轨迹的分布;接下来,一个由高斯驱动的多视图潜变量扩散模型作为装饰者,根据相机轨迹和文本来建模图像序列分布。这个模型是从一个2D扩散模型微调而来,可以直接生成与像素对齐的3D高斯,作为直接的3D场景表现形式,用于三维一致的去噪;最后,这些3D高斯通过一种新颖的融合了2D扩散模型的先验知识的SDS++损失,作为细节优化者进一步细化得到真实的3D场景。

Patent Agency Ranking