Invention Grant
- Patent Title: 说话人声纹特征提取方法、装置、设备及可读存储介质
-
Application No.: CN202411914527.5Application Date: 2024-12-24
-
Publication No.: CN119360860BPublication Date: 2025-04-25
- Inventor: 胡波 , 李娅 , 李嘉琪 , 周斌
- Applicant: 武汉东信同邦信息技术有限公司
- Applicant Address: 湖北省武汉市东湖新技术开发区高新大道999号武汉未来科技城龙山创新园F1栋402室(自贸区武汉片区)
- Assignee: 武汉东信同邦信息技术有限公司
- Current Assignee: 武汉东信同邦信息技术有限公司
- Current Assignee Address: 湖北省武汉市东湖新技术开发区高新大道999号武汉未来科技城龙山创新园F1栋402室(自贸区武汉片区)
- Agency: 武汉智权专利代理事务所
- Agent 刘志荣
- Main IPC: G10L17/02
- IPC: G10L17/02 ; G10L17/18 ; G06N3/049 ; G10L25/24 ; G10L25/30 ; G06N3/0464 ; G06N3/048 ; G06F18/25

Abstract:
一种说话人声纹特征提取方法、装置、设备及可读存储介质,涉及声纹识别技术领域,包括基于深度可分离模块对输入的目标声学特征依次进行逐点卷积、深度卷积和逐点卷积处理,以输出初始特征;通过多粒度时延神经网络中的多层多粒度特征融合层分别对所述初始特征进行不同粒度的特征提取和融合,以输出说话人帧级特征;基于统计池化层对所述说话人帧级特征进行全局特征处理,以输出具有固定长度的特征向量;基于全连接层对所述特征向量进行低维映射处理,以提取说话人嵌入特征。通过本申请可在有效实现说话人特征提取的同时,有效降低模型参数量和计算资源。
Public/Granted literature
- CN119360860A 说话人声纹特征提取方法、装置、设备及可读存储介质 Public/Granted day:2025-01-24
Information query