一种基于非调制声音信号的定位方法及装置

    公开(公告)号:CN118016102B

    公开(公告)日:2024-07-16

    申请号:CN202410410974.0

    申请日:2024-04-08

    Abstract: 本申请实施例提供一种基于非调制声音信号的定位方法及装置,属于语音识别技术领域,其中方法包括:通过FastICA算法对用户设备采集的周围环境的混合音频进行盲源分离,获得至少两组分离音频;使用librosa库将分离音频转换为MFCC特征向量;将MFCC特征向量输入至预训练好的BiLSTM模型,获取分离音频的音频类别;将确定好音频类别的分离音频对应的MFCC特征向量输入至预训练好的LightGBM模型,获取输入MFCC特征向量对应的分离音频的音频距离;基于各个分离音频的音频类别和音频距离,确定用户设备或音频类别对应的声源设备的位置。本申请实施例实现定位不需要依赖于特定的麦克风阵列设备或超声波设备。

    一种基于非调制声音信号的定位方法及装置

    公开(公告)号:CN118016102A

    公开(公告)日:2024-05-10

    申请号:CN202410410974.0

    申请日:2024-04-08

    Abstract: 本申请实施例提供一种基于非调制声音信号的定位方法及装置,属于语音识别技术领域,其中方法包括:通过FastICA算法对用户设备采集的周围环境的混合音频进行盲源分离,获得至少两组分离音频;使用librosa库将分离音频转换为MFCC特征向量;将MFCC特征向量输入至预训练好的BiLSTM模型,获取分离音频的音频类别;将确定好音频类别的分离音频对应的MFCC特征向量输入至预训练好的LightGBM模型,获取输入MFCC特征向量对应的分离音频的音频距离;基于各个分离音频的音频类别和音频距离,确定用户设备或音频类别对应的声源设备的位置。本申请实施例实现定位不需要依赖于特定的麦克风阵列设备或超声波设备。

    一种基于多模态图像融合技术的车辆定位和识别方法

    公开(公告)号:CN117975383A

    公开(公告)日:2024-05-03

    申请号:CN202410387616.2

    申请日:2024-04-01

    Abstract: 本申请公开了一种基于多模态图像融合技术的车辆定位和识别方法,包括:获取目标车辆在当前环境下红外图像和对应的可见光图像;判断当前环境是否为暗光环境,若为暗光环境,则将红外图像和可见光图像输入至融合生成模型,获得融合生成模型输出的增强可见光图像,否则,将可见光图像作为增强可见光图像;将红外图像和增强可见光图像输入至车辆检测模型,获得车辆检测模型输出的目标车辆的位置和型号;车辆检测模型是基于第二样本红外图像和第二样本可见光图像及其对应车辆的位置标签和型号标签训练得到的。通过本申请,实现了对目标车辆的被动定位和车型识别,保证了不同光照情况下都可以获取较为准确的车辆定位和识别结果。

    一种基于多模态图像融合技术的车辆定位和识别方法

    公开(公告)号:CN117975383B

    公开(公告)日:2024-06-21

    申请号:CN202410387616.2

    申请日:2024-04-01

    Abstract: 本申请公开了一种基于多模态图像融合技术的车辆定位和识别方法,包括:获取目标车辆在当前环境下红外图像和对应的可见光图像;判断当前环境是否为暗光环境,若为暗光环境,则将红外图像和可见光图像输入至融合生成模型,获得融合生成模型输出的增强可见光图像,否则,将可见光图像作为增强可见光图像;将红外图像和增强可见光图像输入至车辆检测模型,获得车辆检测模型输出的目标车辆的位置和型号;车辆检测模型是基于第二样本红外图像和第二样本可见光图像及其对应车辆的位置标签和型号标签训练得到的。通过本申请,实现了对目标车辆的被动定位和车型识别,保证了不同光照情况下都可以获取较为准确的车辆定位和识别结果。

Patent Agency Ranking