Adaptive permutation invariant training with auxiliary information for monaural multi-talker speech recognition

Invention Grant

US10699698B2 Adaptive permutation invariant training with auxiliary information for monaural multi-talker speech recognition 有权

Please log in to see more content

Patent Title: Adaptive permutation invariant training with auxiliary information for monaural multi-talker speech recognition
Application No.: US15940246

Application Date: 2018-03-29
Publication No.: US10699698B2

Publication Date: 2020-06-30
Inventor: Yanmin Qian , Dong Yu
Applicant: TENCENT TECHNOLOGY (SHENZHEN) COMPANY LIMITED
Applicant Address: CN Shenzhen
Assignee: TENCENT TECHNOLOGY (SHENZHEN) COMPANY LIMITED
Current Assignee: TENCENT TECHNOLOGY (SHENZHEN) COMPANY LIMITED
Current Assignee Address: CN Shenzhen
Agency: Sughrue Mion, PLLC
Main IPC: G10L15/00
IPC: G10L15/00 ; G10L15/06

Adaptive permutation invariant training with auxiliary information for monaural multi-talker speech recognition

Abstract:

Provided are a speech recognition training processing method and an apparatus including the same. The speech recognition training processing method includes acquiring a stream of speech data from one or more speakers, extracting an auxiliary feature corresponding to a speech characteristic of the one or more speaker and updating an acoustic model by performing permutation invariant training (PIT) model training based on the auxiliary feature.

Public/Granted literature

US20190304438A1 ADAPTIVE PERMUTATION INVARIANT TRAINING WITH AUXILIARY INFORMATION FOR MONAURAL MULTI-TALKER SPEECH RECOGNITION Public/Granted day:2019-10-03

Information query

Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L15/00	语音识别（G10L17/00优先）