연속어 음성 인식 장치 및 방법

    公开(公告)号:KR101905827B1

    公开(公告)日:2018-10-08

    申请号:KR1020130073990

    申请日:2013-06-26

    CPC classification number: G10L15/18 G10L15/04 G10L15/32

    Abstract: 본발명은대용량어휘가포함된연속어에대하여음성인식을수행하는장치및 방법에관한것이다. 본발명은동일종류의어휘의수가매우많은대어휘연속어에서대어휘를적당한개수의클러스터로나누고, 해당클러스터의대표어휘를선정하여대표어휘만포함된 1단계인식을수행하며, 1단계수행한결과를이용하여대표어휘가인식되었을경우인식된대표어휘가속한클러스터내의모든단어에대하여재인식을수행한다.

    심층 신경망 기반의 음성 인식 시스템 및 방법
    7.
    发明公开
    심층 신경망 기반의 음성 인식 시스템 및 방법 审中-实审
    基于深度神经网络的语音识别系统和方法

    公开(公告)号:KR1020170091903A

    公开(公告)日:2017-08-10

    申请号:KR1020160012761

    申请日:2016-02-02

    Abstract: 본발명의목적은, 심층신경망계산에소요되는시간을줄임으로써음성인식속도를개선할수 있는, 심층신경망기반의음성인식시스템을제공하는것이다. 이를위해, 본발명에따른심층신경망기반의음성인식시스템은, 각종정보들을입력받는입력부; 프로그램들과정보들을저장하는저장부; 상기입력부를통해입력된정보들을상기프로그램들을이용해처리하는제어부; 및상기제어부에의해처리된결과를출력하는출력부를포함하며, 상기제어부는, 심층신경망의출력노드별오류에영향을미치는정도가큰 노드들을서브그래프로표현하고, 상기노드들을비터디디코딩시에계산한다.

    Abstract translation: 本发明的一个目的是提供一种基于神经网络的语音识别系统,它能够通过减少计算神经网络所需的时间来提高语音识别速度。 为此,根据本发明的基于景深神经网络的语音识别系统包括:输入单元,用于接收各种信息; 存储程序和信息的存储单元; 控制单元,用于使用程序处理通过输入单元输入的信息; 并包括用于输出由所述控制单元,其中,对由深度的输出节点处的误差的影响程度的神经网络表示到子图中最大的节点处理的结果的输出,并在搅拌器二时间的节点解码 据计算。

    음성 인식을 위한 특징 보상 시스템 및 방법
    8.
    发明公开
    음성 인식을 위한 특징 보상 시스템 및 방법 审中-实审
    特征补偿系统和语音识别方法

    公开(公告)号:KR1020170087211A

    公开(公告)日:2017-07-28

    申请号:KR1020160006916

    申请日:2016-01-20

    Abstract: 본발명은음성인식을위한특징보상기술에관한것으로, 본발명에따른특징보상시스템은, 오염된음성신호로부터오염된음성특성을추출하는특징추출부; 훈련음성특징, 훈련잡음특징및 훈련오염된음성특징으로부터심층신경망을기반으로하여비선형관계모델을생성하는관계모델생성부; 상기오염된음성특징과, 과거프레임에서보상된음성특징을이용하여평균과공분산을포함한잡음특징의확률분포를추정하는잡음특징확률분포추정부; 상기잡음특징의확률분포를반영하여잡음특징을표본화하는잡음표본화부; 상기심층신경망기반비선형관계모델을기반으로상기오염된음성특징에서상기표본화된잡음특징을제거하는잡음제거부; 및상기표본화된잡음특징이제거된음성특징을결합하여보상된음성특징을생성하는특징결합부로구성된다.

    Abstract translation: 本发明涉及一种特性补偿技术用于语音识别,根据本发明,用于从污染污染的语音信号中提取语音特征的特征提取单元,其特征在于,在补偿系统; 关系模型生成单元,用于根据训练语音特征,训练噪声特征和污染语音特征生成基于深度神经网络的非线性关系模型; 其中,估计所述被污染的语音特征和噪声特性的概率分布,包括使用来自先前帧的噪声特性概率分布估计单元经补偿的语音特征的均值和协方差; 噪声采样单元,用于通过反映噪声特性的概率分布来采样噪声特性; 用于去除在被污染的语音特征的基于深度的神经网络模型的采样噪声特性的噪声去除是基于非线性关系; 以及特征组合单元,用于通过将采样的语音特征与去除的语音特征组合来生成补偿语音特征。

    음성인식 장치 및 방법
    9.
    发明公开
    음성인식 장치 및 방법 审中-实审
    语音识别装置和方法

    公开(公告)号:KR1020170086214A

    公开(公告)日:2017-07-26

    申请号:KR1020160005755

    申请日:2016-01-18

    Abstract: 본발명에따른심층신경망음향모델에기초한음성인식장치는메모리및 상기메모리에저장된프로그램을실행시키는프로세서를포함하되, 상기프로세서는상기프로그램을실행시킴에따라, 다중집합훈련음성데이터에포함된복수의집합훈련음성데이터각각에대응하는음향모델상태집합을생성하고, 상기음향모델상태집합으로부터다중집합상태클러스터를생성하며, 상기다중집합훈련음성데이터를입력노드로설정하고, 상기다중집합상태클러스터를출력노드로설정하여, 심층신경망구조파라미터를학습하며, 사용자인터페이스를통해사용자의음성및 상기음성의특성정보를입력받으면, 상기다중집합훈련음성데이터중 상기음성의특성정보에대응하는집합훈련음성데이터를입력노드로설정하고, 상기집합훈련음성데이터에대응하는음향모델상태집합을출력노드로설정하여, 상기학습된심층신경망구조파라미터에기초하여사용자의음성을인식한다.

    Abstract translation: 根据本发明的基于深度神经网络声学模型的语音识别设备包括存储器和用于执行存储在存储器中的程序的处理器,其中处理器执行程序以产生多个 生成与每个设置的训练声音数据相对应的一组声学模型状态,从声学模型状态组生成多组状态组,将多组训练声音数据设置为输入节点, 训练数据节点,学习神经网络结构参数,通过用户界面接收用户的语音和语音的特征信息;然后,将多语言训练数据中与语音特征信息对应的训练语音数据集合, 并将与所设置的训练语音数据对应的一组声学模型状态设置到输出节点 任命,并认识基础上,深入学习神经网络结构参数的用户的声音。

    하모닉 성분 재설정 검출 기반의 발성 속도 결정 장치 그 방법
    10.
    发明公开
    하모닉 성분 재설정 검출 기반의 발성 속도 결정 장치 그 방법 审中-实审
    基于谐波分量重置检测的语速确定装置

    公开(公告)号:KR1020170082892A

    公开(公告)日:2017-07-17

    申请号:KR1020160002180

    申请日:2016-01-07

    Abstract: 본발명은음성인식시스템에서다양한발성속도를갖는자연어인식성능을향상시킬수 있도록한 하모닉성분재설정검출기반의발성속도결정장치및 그방법에관한것으로서, 모음의강한하모닉성분의존재로발생하는하모닉성분재설정을활용함으로써발성속도의차이에따른자연어인식기의성능저하를줄일수 있고, 음절경계를추정함으로써장음화현상을검출하고이것을자연어인식기의성능개선에활용될수 있으며, 또한, 주파수영역에서하모닉성분을추정하는방법은피치의이득을구하는방법보다정교하기때문에정확한발성속도를얻고음성인식성능이향상되도록하는것이다.

    Abstract translation: 本发明重置由相关的存在给语音识别产生的高次谐波分量重置谐波分量,从而能够提高与各种系统中的话音速率的自然语言识别性能是基于所述话音速率确定在收集谐波分量的设备和方法,强烈检测到的 通过利用它可以根据在语音速度差减少自然语言标识符的降解,通过估计音节边界并检测jangeumhwa现象和可利用它来提高自然语言标识符的性能,而且,对于在频域中估计的谐波分量 该方法比获得音调增益的方法更加复杂,从而获得准确的语音速度并改善语音识别性能。

Patent Agency Ranking