-
公开(公告)号:CN118016102B
公开(公告)日:2024-07-16
申请号:CN202410410974.0
申请日:2024-04-08
Applicant: 湖北经济学院
IPC: G10L25/51 , G06N3/0442 , G06N3/08 , G10L25/30 , G10L25/24 , G10L21/0272 , G01S5/22
Abstract: 本申请实施例提供一种基于非调制声音信号的定位方法及装置,属于语音识别技术领域,其中方法包括:通过FastICA算法对用户设备采集的周围环境的混合音频进行盲源分离,获得至少两组分离音频;使用librosa库将分离音频转换为MFCC特征向量;将MFCC特征向量输入至预训练好的BiLSTM模型,获取分离音频的音频类别;将确定好音频类别的分离音频对应的MFCC特征向量输入至预训练好的LightGBM模型,获取输入MFCC特征向量对应的分离音频的音频距离;基于各个分离音频的音频类别和音频距离,确定用户设备或音频类别对应的声源设备的位置。本申请实施例实现定位不需要依赖于特定的麦克风阵列设备或超声波设备。
-
公开(公告)号:CN118016102A
公开(公告)日:2024-05-10
申请号:CN202410410974.0
申请日:2024-04-08
Applicant: 湖北经济学院
IPC: G10L25/51 , G06N3/0442 , G06N3/08 , G10L25/30 , G10L25/24 , G10L21/0272 , G01S5/22
Abstract: 本申请实施例提供一种基于非调制声音信号的定位方法及装置,属于语音识别技术领域,其中方法包括:通过FastICA算法对用户设备采集的周围环境的混合音频进行盲源分离,获得至少两组分离音频;使用librosa库将分离音频转换为MFCC特征向量;将MFCC特征向量输入至预训练好的BiLSTM模型,获取分离音频的音频类别;将确定好音频类别的分离音频对应的MFCC特征向量输入至预训练好的LightGBM模型,获取输入MFCC特征向量对应的分离音频的音频距离;基于各个分离音频的音频类别和音频距离,确定用户设备或音频类别对应的声源设备的位置。本申请实施例实现定位不需要依赖于特定的麦克风阵列设备或超声波设备。
-