一种采用稀疏体素融合的3D目标检测方法、装置、设备及存储介质

    公开(公告)号:CN117115526A

    公开(公告)日:2023-11-24

    申请号:CN202311043086.1

    申请日:2023-08-18

    Applicant: 同济大学

    Abstract: 本发明涉及一种采用稀疏体素融合的3D目标检测方法、装置、设备及存储介质,其中,该方法包括以下步骤:将采集的点云同时进行立方体素化和柱状体素化,得到前景立方体素和柱状体素;计算柱状体素质心和前景立方体素质心,并提取体素质心作为体素特征;将前景立方体素的特征与柱状体素特征融合,得到第一阶段增强的立方体素特征;选择物体中心的立方体素作为中心体素,根据所述的中心体素得到中心体素特征,将中心体素特征与第一阶段增强的立方体素特征聚合,得到第二阶段增强的立方体素;将第二阶段增强的立方体素送入3D目标检测器中实现目标检测。与现有技术相比,本发明具有起到了有效检测远距离、小目标的检测效果等优点。

    基于多粒度解码器的文本-图像检测方法

    公开(公告)号:CN116912663A

    公开(公告)日:2023-10-20

    申请号:CN202310898188.5

    申请日:2023-07-20

    Applicant: 同济大学

    Abstract: 本案涉及基于多粒度解码器的文本‑图像检测方法,属于图像目标检测领域,用于解决目前检测相关的文本‑图像任务模型无法灵活使用语言描述图像中物体或须假设被描述物体有且仅有一个的问题。本案根据任务类型配置不同粒度的解码器构成多粒度解码器,对以文字描述和/或包围盒形式对图像中目标对象进行描述的文本图像任务,获取任务中图像和文本的融合特征序列;当把融合特征序列作为多粒度解码器的输入时,多粒度解码器输出文本‑图像任务检测结果。本案将各种与检测定位相关的文本‑图像任务统一为基于文本描述物体检测任务,有效统一了各种任务形式;多粒度解码器具有可扩展性,训练好的多粒度解码器能够实现对不同文本图像任务的推理。

Patent Agency Ranking