三维重建方法、装置、设备及存储介质

    公开(公告)号:CN118351235A

    公开(公告)日:2024-07-16

    申请号:CN202410352394.0

    申请日:2024-03-26

    Abstract: 本申请提出一种三维重建方法、装置、设备及存储介质,该方法包括:获取待重建物体在稀疏视角下各视角对应的偏振图像;基于各偏振图像,计算各视角的出射斯托克斯向量;基于各视角的出射斯托克斯向量对各视角下任一点的法向量和光强进行约束,得到针对各视角下任一点的约束结果;基于各视角下所有点的约束结果,对待重建物体进行重建。本申请实施例在物体的重建过程中对物体的各个点进行法向量约束和光强约束,即在重建过程中利用了视角中的几何信息和光度信息,可以在稀疏视角条件下对高反光率的物体进行重建,提高重建物体的完整性。

    一种类别分类方法、装置、介质及设备

    公开(公告)号:CN117115497A

    公开(公告)日:2023-11-24

    申请号:CN202310076588.8

    申请日:2023-01-16

    Abstract: 本公开提供了一种类别分类方法、装置、介质及设备,所述方法包括:定义在线类别挖掘数据结构;构构建分类模型,其中,所述分类模型包括:用于特征提取的编码器 和用于将提取到的特征投影到有判别力的表征空间的投影器 基于所述数据结构中用于训练的数据对所述分类模型进行训练;基于所述数据结构中用于测试的数据对训练后的分类模型进行分类测试。本公开的方法与现有技术相比,实现了不依赖辅助信息,面向开放数据,实例级即使预测的未见类别挖掘。在6个常用的分类数据集上验证了本公开所提方法的优越性。

    一种模型训练、图像识别方法、装置、设备及存储介质

    公开(公告)号:CN116091867A

    公开(公告)日:2023-05-09

    申请号:CN202310063908.6

    申请日:2023-01-12

    Abstract: 本申请提供了一种模型训练、图像识别方法、装置、设备及存储介质,所述方法包括:在源域数据集中随机获取多个图像插曲;构建任务感知的自适应学习网络模型;将所述图像插曲输入所述自适应学习网络模型,得到所述图像插曲中的支持样本与查询样本的特征图;根据所述支持样本与所述查询样本的特征图确定分类损失,根据所述图像插曲与目标域数据集的域偏移确定自适应损失,根据所述分类损失与所述自适应损失确定整体损失;根据所述整体损失调整所述自适应学习网络模型,直至所述整体损失收敛为止。本申请中,通过将域偏移引入损失函数,从而使得训练后的模型可以兼顾具备不同域偏移的目标数据集,达到更准确的图像识别效果。

    一种语义分割方法和系统
    8.
    发明公开

    公开(公告)号:CN115222940A

    公开(公告)日:2022-10-21

    申请号:CN202210795660.8

    申请日:2022-07-07

    Abstract: 本申请实施例公开了一种语义分割方法和系统,所述方法包括:将源域图片转化为拟真域图片;将所述源域图片及其真实标注、所述拟真域图片输入第一中间级熵对齐网络,输出拟真域预测结果;将所述源域图片及其真实标注、所述目标域图片输入第二中间级熵对齐网络,输出目标域预测结果;利用所述拟真域预测结果和源域图片的真实标注训练输出级预测修正网络;将所述目标域预测结果输入所述输出级预测修正网络进行掩码修正,得到修正后的掩码结果。降低源域和目标域间的域隙,达到更好的域迁移目的。

    音频信号内容分析方法、装置、设备及存储介质

    公开(公告)号:CN117594060B

    公开(公告)日:2024-12-03

    申请号:CN202311435217.0

    申请日:2023-10-31

    Abstract: 本申请提出一种音频信号内容分析方法、设备及存储介质,该方法包括:获取待处理的目标音频信号的目标音频特征;基于目标嵌入特征和目标音频特征,确定当前时间步的特征概率分布,目标嵌入特征为前一时间步的描述词的原始词嵌入特征或者目标音频信号的预设词嵌入特征;基于特征概率分布从特征概率分布的多个潜在特征中选取当前时间步的目标潜在特征;基于多个时间步的目标词潜在特征和目标音频特征,生成目标音频信号对应的目标描述信息。本申请实施例实现了可以基于音频信号生成不同的描述信息。

    低资源的音频字幕生成方法、装置、电子设备及介质

    公开(公告)号:CN117809654B

    公开(公告)日:2024-11-12

    申请号:CN202311593526.0

    申请日:2023-11-27

    Abstract: 本申请公开了一种低资源的音频字幕生成方法、装置、电子设备及介质。通过应用本申请的技术方案,可以在一个包含语言编码器与音频编码器的多模态预训练模型中,首先利用样本量比较充足的文本数据,为已有的语言编码器训练得到一个语言解码器。并在后续将该语言编码器替换为音频编码器,以达到间接为音频编码器训练得到语言解码器的目的。以使后续仅用样本量较少的音频配对数据也能训练得到一个精度较高的音频多模态预训练模型。从而实现了一种在仅有少量可供训练音频‑字幕数据对的情况下,仍能取得较高模型性能的技术方案。

Patent Agency Ranking