一种基于多模态图像融合技术的车辆定位和识别方法

    公开(公告)号:CN117975383B

    公开(公告)日:2024-06-21

    申请号:CN202410387616.2

    申请日:2024-04-01

    Abstract: 本申请公开了一种基于多模态图像融合技术的车辆定位和识别方法,包括:获取目标车辆在当前环境下红外图像和对应的可见光图像;判断当前环境是否为暗光环境,若为暗光环境,则将红外图像和可见光图像输入至融合生成模型,获得融合生成模型输出的增强可见光图像,否则,将可见光图像作为增强可见光图像;将红外图像和增强可见光图像输入至车辆检测模型,获得车辆检测模型输出的目标车辆的位置和型号;车辆检测模型是基于第二样本红外图像和第二样本可见光图像及其对应车辆的位置标签和型号标签训练得到的。通过本申请,实现了对目标车辆的被动定位和车型识别,保证了不同光照情况下都可以获取较为准确的车辆定位和识别结果。

    基于深度学习的LED光源识别方法、装置、设备及介质

    公开(公告)号:CN117611929B

    公开(公告)日:2024-04-23

    申请号:CN202410088953.1

    申请日:2024-01-23

    Abstract: 本发明提供一种基于深度学习的LED光源识别方法、装置、设备及介质,属于室内定位导航技术领域,所述方法包括:在LED照明环境下,通过CMOS相机获取样条帧,样条帧为具有暗样条纹的图像;输入样条帧至目标检测模型,获取目标检测模型输出的暗样条纹检测结果;对多个矩形框进行预处理以及基于各个预处理后矩形框对应的预测分类,确定样条帧的图像特征编码序列;将图像特征编码序列与各个LED光源对应的光源特征编码序列进行比对,确定与样条帧最匹配的光源特征编码序列。光源特征编码序列能够用于标识LED光源,因而能够确定CMOS相机的当前位置位于最匹配的光源特征编码序列所标识LED光源的附近,高效地进行室内定位。

    一种面向相机光通信的条纹图像处理方法、装置及设备

    公开(公告)号:CN118298194B

    公开(公告)日:2024-08-02

    申请号:CN202410725911.4

    申请日:2024-06-06

    Abstract: 本申请属于可见光通信领域,具体公开了一种面向相机光通信的条纹图像处理方法、装置及设备,该方法包括:获取条纹图像数据集,条纹图像数据集包括条纹图像样本和条纹图像样本对应的条纹序列标签以及无条纹图像标签;基于条纹图像样本和条纹图像样本对应的条纹序列标签以及无条纹图像标签,训练生成对抗网络,获取图像重建模型和条纹提取模型;图像重建模型作为生成对抗网络的生成器,条纹提取模型作为生成对抗网络的判别器。通过本申请,利用GAN将两种矛盾性质的任务进行生成对抗,能够有效地均衡图像重建准确度和条纹提取准确度,获得适用于可见光通信场景的图像重建模型和条纹提取模型。

    一种基于非调制声音信号的定位方法及装置

    公开(公告)号:CN118016102B

    公开(公告)日:2024-07-16

    申请号:CN202410410974.0

    申请日:2024-04-08

    Abstract: 本申请实施例提供一种基于非调制声音信号的定位方法及装置,属于语音识别技术领域,其中方法包括:通过FastICA算法对用户设备采集的周围环境的混合音频进行盲源分离,获得至少两组分离音频;使用librosa库将分离音频转换为MFCC特征向量;将MFCC特征向量输入至预训练好的BiLSTM模型,获取分离音频的音频类别;将确定好音频类别的分离音频对应的MFCC特征向量输入至预训练好的LightGBM模型,获取输入MFCC特征向量对应的分离音频的音频距离;基于各个分离音频的音频类别和音频距离,确定用户设备或音频类别对应的声源设备的位置。本申请实施例实现定位不需要依赖于特定的麦克风阵列设备或超声波设备。

    一种面向相机光通信的条纹图像处理方法、装置及设备

    公开(公告)号:CN118298194A

    公开(公告)日:2024-07-05

    申请号:CN202410725911.4

    申请日:2024-06-06

    Abstract: 本申请属于可见光通信领域,具体公开了一种面向相机光通信的条纹图像处理方法、装置及设备,该方法包括:获取条纹图像数据集,条纹图像数据集包括条纹图像样本和条纹图像样本对应的条纹序列标签以及无条纹图像标签;基于条纹图像样本和条纹图像样本对应的条纹序列标签以及无条纹图像标签,训练生成对抗网络,获取图像重建模型和条纹提取模型;图像重建模型作为生成对抗网络的生成器,条纹提取模型作为生成对抗网络的判别器。通过本申请,利用GAN将两种矛盾性质的任务进行生成对抗,能够有效地均衡图像重建准确度和条纹提取准确度,获得适用于可见光通信场景的图像重建模型和条纹提取模型。

    一种基于非调制声音信号的定位方法及装置

    公开(公告)号:CN118016102A

    公开(公告)日:2024-05-10

    申请号:CN202410410974.0

    申请日:2024-04-08

    Abstract: 本申请实施例提供一种基于非调制声音信号的定位方法及装置,属于语音识别技术领域,其中方法包括:通过FastICA算法对用户设备采集的周围环境的混合音频进行盲源分离,获得至少两组分离音频;使用librosa库将分离音频转换为MFCC特征向量;将MFCC特征向量输入至预训练好的BiLSTM模型,获取分离音频的音频类别;将确定好音频类别的分离音频对应的MFCC特征向量输入至预训练好的LightGBM模型,获取输入MFCC特征向量对应的分离音频的音频距离;基于各个分离音频的音频类别和音频距离,确定用户设备或音频类别对应的声源设备的位置。本申请实施例实现定位不需要依赖于特定的麦克风阵列设备或超声波设备。

    一种基于多模态图像融合技术的车辆定位和识别方法

    公开(公告)号:CN117975383A

    公开(公告)日:2024-05-03

    申请号:CN202410387616.2

    申请日:2024-04-01

    Abstract: 本申请公开了一种基于多模态图像融合技术的车辆定位和识别方法,包括:获取目标车辆在当前环境下红外图像和对应的可见光图像;判断当前环境是否为暗光环境,若为暗光环境,则将红外图像和可见光图像输入至融合生成模型,获得融合生成模型输出的增强可见光图像,否则,将可见光图像作为增强可见光图像;将红外图像和增强可见光图像输入至车辆检测模型,获得车辆检测模型输出的目标车辆的位置和型号;车辆检测模型是基于第二样本红外图像和第二样本可见光图像及其对应车辆的位置标签和型号标签训练得到的。通过本申请,实现了对目标车辆的被动定位和车型识别,保证了不同光照情况下都可以获取较为准确的车辆定位和识别结果。

Patent Agency Ranking