-
公开(公告)号:CN110383377B
公开(公告)日:2023-10-13
申请号:CN201880015644.4
申请日:2018-02-23
Applicant: 三菱电机株式会社
IPC: G10L21/0216 , G10L15/16 , G10L15/20
Abstract: 一种语音识别系统包括接收包括语音信号的声信号的多个麦克风;从声信号生成多通道输入的输入接口;存储多通道语音识别网络的一个或多个储存器,其中,多通道语音识别网络包括从多通道输入生成时间‑频率掩模的掩模估计网络;被训练为使用时间‑频率掩模从多通道输入中选择基准通道输入并且基于基准通道输入生成增强语音数据集的波束形成器网络;以及被训练为将增强语音数据集变换为文本的编码器‑解码器网络。系统还包括与一个或多个储存器关联地使用多通道语音识别网络以从多通道输入生成文本的一个或多个处理器;和渲染文本的输出接口。
-
公开(公告)号:CN110383377A
公开(公告)日:2019-10-25
申请号:CN201880015644.4
申请日:2018-02-23
Applicant: 三菱电机株式会社
IPC: G10L21/0216 , G10L15/16 , G10L15/20
Abstract: 一种语音识别系统包括接收包括语音信号的声信号的多个麦克风;从声信号生成多通道输入的输入接口;存储多通道语音识别网络的一个或多个储存器,其中,多通道语音识别网络包括从多通道输入生成时间-频率掩模的掩模估计网络;被训练为使用时间-频率掩模从多通道输入中选择基准通道输入并且基于基准通道输入生成增强语音数据集的波束形成器网络;以及被训练为将增强语音数据集变换为文本的编码器-解码器网络。系统还包括与一个或多个储存器关联地使用多通道语音识别网络以从多通道输入生成文本的一个或多个处理器;和渲染文本的输出接口。
-