一种车辆自动滑移门的声纹识别方法

    公开(公告)号:CN117037802A

    公开(公告)日:2023-11-10

    申请号:CN202311140809.X

    申请日:2023-09-05

    Inventor: 张斌 徐宇强

    Abstract: 本发明提供的是一种车辆自动滑移门的声纹识别方法,涉及声纹识别技术领域。本发明通过用户声纹注册,声纹数据采集,语音活动检测,用户声纹特征的验证的方法实现了一种车辆自动滑移门的声纹识别方法。本发明使用一种帧级别音频特征比对方法进行音频粗比对是否是同一用户,在包含声纹训练数据收集、声纹数据注册、用户声纹验证过程中,进行一个低计算量、较高检错率的用户声纹识别,以达到在使用声纹神经网络模型之前就能够将一些干扰音频剔除在外以及提高对长时语音的识别;本申请设计所有算法模型都可部署在同一、离线、本地的存储介质上,且无需与云服务器进行交互。

    一种基于Transformer和CNN长时语音的声纹识别方法

    公开(公告)号:CN116844554A

    公开(公告)日:2023-10-03

    申请号:CN202310813399.4

    申请日:2023-07-04

    Inventor: 张斌 徐宇强

    Abstract: 本发明提供的是一种结合Transformer和CNN的一种长时语音的声纹识别方法,涉及音频识别技术领域。该方法步骤包括:S1,输入长时语音信号;S2,对长时语音进行预处理;S3,进行Fbank特征的提取;S4,进行声纹识别模型的训练;S5,特征匹配与识别;S6,输出识别结果;本发明在长时语音的声纹识别上准确率,解码速度更快,在多个数据集上验证后等错率达到了1.2%,其中在Sitw数据集上最好达到了0.9%的等错率。

Patent Agency Ranking