딥 뉴럴 네트워크 기반 특징 보상 기법을 이용한 음성 인식 방법
    2.
    发明授权
    딥 뉴럴 네트워크 기반 특징 보상 기법을 이용한 음성 인식 방법 有权
    使用基于深层神经网络的特征补偿的语音识别方法

    公开(公告)号:KR101624926B1

    公开(公告)日:2016-05-27

    申请号:KR1020140182745

    申请日:2014-12-17

    CPC classification number: G10L15/16 G10L15/20 G10L25/30 Y10S706/90

    Abstract: 본발명은딥 뉴럴네트워크기반특징보상기법을이용한음성인식방법에관한것으로서, 보다구체적으로는 (1) 잡음이혼합된학습데이터를이용해딥 뉴럴네트워크(Deep Neural Network; DNN)를학습하는단계; (2) 테스트데이터를상기학습된딥 뉴럴네트워크에적용하여보상된특징벡터또는스테이트사후확률을도출하는단계; 및 (3) 상기단계 (2)에서도출된보상된특징벡터또는스테이트사후확률을이용해, 음성인식결과를도출하는단계를포함하는것을그 구성상의특징으로한다. 본발명에서제안하고있는딥 뉴럴네트워크기반특징보상기법을이용한음성인식방법에따르면, 잡음이혼합된학습데이터를이용해딥 뉴럴네트워크를학습함으로써, 잡음과깨끗한음성과의관계를자동으로학습할수 있으며, 학습된딥 뉴럴네트워크에테스트데이터를적용하여보상된특징벡터또는스테이트사후확률을도출하고, 이를이용해음성인식결과를도출함으로써, 어떤잡음에서도정확한특징보상이이루어질수 있고, 이를통해향상된음성인식결과를얻을수 있다. 또한, 본발명에따르면, 특징벡터또는스테이트사후확률에대하여딥 뉴럴네트워크를학습하고, 학습된딥 뉴럴네트워크를통해보상된특징벡터또는스테이트사후확률을얻을수 있으므로, 디코더의종류에따라다양한방식으로음성인식에적용될수 있다.

    Abstract translation: 本发明涉及一种通过使用基于深神经网络(DNN)的特征补偿技术的语音识别方法。 更具体地说,本发明包括:(1)通过使用与噪声混合的学习数据来学习DNN的步骤; (2)通过将测试数据应用于所学习的DNN来计算补偿特征向量或后验状态概率的步骤; 和(3)通过使用在步骤(2)中计算的补偿特征向量或后验状态概率来绘制语音识别结果的步骤。 根据通过使用基于本发明提出的DNN的特征补偿技术的语音识别方法,可以通过使用与噪声混合的学习数据学习DNN来自动学习噪声与干净语音之间的关系 并用任何噪声进行精确的特征补偿,从而通过将测试数据应用于学习的DNN并通过使用相同的语音识别结果绘制补偿特征向量或后验状态概率来获得改进的语音识别结果 。 此外,本发明能够根据解码器类型以各种模式应用于语音识别,因为本发明能够根据特征向量或后验状态概率学习DNN,并获得补偿后的特征向量或 通过学习的DNN的后验状态概率。

Patent Agency Ranking