-
公开(公告)号:KR101924192B1
公开(公告)日:2018-11-30
申请号:KR1020100046928
申请日:2010-05-19
Applicant: 한국전자통신연구원
CPC classification number: G10L19/02 , G10L19/0212 , G10L19/24
Abstract: 본발명은오디오신호의인코딩및 디코딩방법및 장치에관한것이다. 본발명의일 실시예에의한오디오신호의인코딩방법은, 변환된오디오신호를입력받는단계, 변환된오디오신호를복수개의서브대역으로나누는단계, 복수개의서브대역에대하여제1 정현파코딩을수행하는단계, 제1 정현파코딩의코딩정보를이용하여, 복수개의서브대역중 제2 정현파코딩의수행영역을결정하는단계및 수행영역에대하여제2 정현파코딩을수행하는단계를포함하고, 제1 정현파코딩수행단계는상기코딩정보에따라가변적으로수행되는것을특징으로한다. 본발명에의하면계층형정현파코딩을이용하여상위계층에서오디오신호를인코딩또는디코딩할때, 하위계층의정현파코딩을고려함으로써합성신호의품질을더욱향상시킬수 있는효과가있다.
-
公开(公告)号:KR101819180B1
公开(公告)日:2018-01-16
申请号:KR1020110029340
申请日:2011-03-31
Applicant: 한국전자통신연구원
IPC: G10L19/005 , G10L19/02 , G10L19/032
CPC classification number: G10L19/0212 , G10L19/0017 , G10L19/032 , G10L19/24
Abstract: 부호화기의부호화방법이제공된다. 부호화기는입력신호를변환하여제1 MDCT 계수를생성하고, 제1 MDCT 계수를양자화하여 MDCT 인덱스를생성한다. 부호화기는 MDCT 인덱스를역 양자화하여제2 MDCT 계수를생성하고, 제1 MDCT 계수와제2 MDCT 계수의차로 MDCT 오류계수를계산한다. 다음부호화기는 MDCT 오류계수를부호화하여오류인덱스를생성하고, 제1 MDCT 계수와제2 MDCT 계수로부터제1 MDCT 계수의이득에대응하는이득인덱스를생성한다.
Abstract translation: 编码器的编码方法被提供。 编码器转换输入信号以生成第一MDCT系数,并量化第一MDCT系数以生成MDCT索引。 编码器通过对MDCT索引进行解量化来生成第二MDCT系数,并且通过第一MDCT系数与第二MDCT系数之间的差来计算MDCT误差系数。 则编码器产生对应于权利要求的增益从MDCT系数11个MDCT系数和权利要求2个的MDCT系数进行编码的MDCT系数误差产生的差错索引和增益索引。
-
公开(公告)号:KR1020170087211A
公开(公告)日:2017-07-28
申请号:KR1020160006916
申请日:2016-01-20
Applicant: 한국전자통신연구원
Abstract: 본발명은음성인식을위한특징보상기술에관한것으로, 본발명에따른특징보상시스템은, 오염된음성신호로부터오염된음성특성을추출하는특징추출부; 훈련음성특징, 훈련잡음특징및 훈련오염된음성특징으로부터심층신경망을기반으로하여비선형관계모델을생성하는관계모델생성부; 상기오염된음성특징과, 과거프레임에서보상된음성특징을이용하여평균과공분산을포함한잡음특징의확률분포를추정하는잡음특징확률분포추정부; 상기잡음특징의확률분포를반영하여잡음특징을표본화하는잡음표본화부; 상기심층신경망기반비선형관계모델을기반으로상기오염된음성특징에서상기표본화된잡음특징을제거하는잡음제거부; 및상기표본화된잡음특징이제거된음성특징을결합하여보상된음성특징을생성하는특징결합부로구성된다.
Abstract translation: 本发明涉及一种特性补偿技术用于语音识别,根据本发明,用于从污染污染的语音信号中提取语音特征的特征提取单元,其特征在于,在补偿系统; 关系模型生成单元,用于根据训练语音特征,训练噪声特征和污染语音特征生成基于深度神经网络的非线性关系模型; 其中,估计所述被污染的语音特征和噪声特性的概率分布,包括使用来自先前帧的噪声特性概率分布估计单元经补偿的语音特征的均值和协方差; 噪声采样单元,用于通过反映噪声特性的概率分布来采样噪声特性; 用于去除在被污染的语音特征的基于深度的神经网络模型的采样噪声特性的噪声去除是基于非线性关系; 以及特征组合单元,用于通过将采样的语音特征与去除的语音特征组合来生成补偿语音特征。
-
公开(公告)号:KR1020170082892A
公开(公告)日:2017-07-17
申请号:KR1020160002180
申请日:2016-01-07
Applicant: 한국전자통신연구원
IPC: G10L15/00 , G10L15/18 , G10L15/22 , G10L15/187
Abstract: 본발명은음성인식시스템에서다양한발성속도를갖는자연어인식성능을향상시킬수 있도록한 하모닉성분재설정검출기반의발성속도결정장치및 그방법에관한것으로서, 모음의강한하모닉성분의존재로발생하는하모닉성분재설정을활용함으로써발성속도의차이에따른자연어인식기의성능저하를줄일수 있고, 음절경계를추정함으로써장음화현상을검출하고이것을자연어인식기의성능개선에활용될수 있으며, 또한, 주파수영역에서하모닉성분을추정하는방법은피치의이득을구하는방법보다정교하기때문에정확한발성속도를얻고음성인식성능이향상되도록하는것이다.
Abstract translation: 本发明重置由相关的存在给语音识别产生的高次谐波分量重置谐波分量,从而能够提高与各种系统中的话音速率的自然语言识别性能是基于所述话音速率确定在收集谐波分量的设备和方法,强烈检测到的 通过利用它可以根据在语音速度差减少自然语言标识符的降解,通过估计音节边界并检测jangeumhwa现象和可利用它来提高自然语言标识符的性能,而且,对于在频域中估计的谐波分量 该方法比获得音调增益的方法更加复杂,从而获得准确的语音速度并改善语音识别性能。
-
公开(公告)号:KR101709184B1
公开(公告)日:2017-02-22
申请号:KR1020140080789
申请日:2014-06-30
Applicant: 한국전자통신연구원
Inventor: 김현우
Abstract: 실내측위기술을이용한다채널마이크로폰의잡음제거기술이개시된다. 본발명의일 면에따른실내측위기술을이용한다채널마이크로폰의잡음제거장치는실내측위기술을이용하여획득되는화자의위치정보를이용하여, 다채널마이크로폰의배열에기반한 상기화자의상대적인위치좌표를검출하는위치검출부, 상기화자의상대적인위치좌표로부터송출되는상기화자의음성이상기다채널마이크로폰에포함된마이크로폰들에도착하는시간간의차이(Time Difference of Arrival, TDoA, 이하도착시간간의차이)를계산하는도착시간차이계산부, 상기화자의상대적인위치좌표로부터송출되는상기화자의음성이상기다채널마이크로폰에도달할때의신호감쇄율을계산하는신호감쇄율계산부, 및상기도착시간간의차이와상기신호감쇄율을이용하여상기화자의음성을강화하고잡음을제거하는다중빔 형성부를포함한다.
Abstract translation: 公开了使用室内定位技术的多声道麦克风的噪声去除技术。 根据本发明的实施例的用于消除多声道麦克风的噪声的装置包括:位置检测单元,其通过使用扬声器的位置信息来检测基于多声道麦克风的布置的扬声器的相对位置坐标 通过使用室内定位技术获得; 到达时间差计算单元,其计算从扬声器的相对位置坐标发射的扬声器的语音到达时间之间的到达时间差(TDoA)到包括在多声道麦克风中的麦克风; 信号衰减率计算单元,当从扬声器的相对位置坐标发出的扬声器的声音到达多声道麦克风时,计算信号衰减比; 以及通过使用TDoA和信号衰减比来增强扬声器的声音并消除噪声的多波束形成单元。
-
公开(公告)号:KR1020160112793A
公开(公告)日:2016-09-28
申请号:KR1020150039098
申请日:2015-03-20
Applicant: 한국전자통신연구원
IPC: G10L21/0216 , G10L15/02 , G10L15/14
CPC classification number: G10L15/20 , G10L15/02 , G10L21/0216 , G10L15/142
Abstract: 본발명에따른잡음환경에서의음성인식을위한특징보상장치는둘 이상의프레임으로구성된잡음이부가된오염된음성신호로부터음성신호특징정보를추출하는특징추출부, 추출된음성신호특징정보및 보상된음성특징으로부터잡음특징정보를추정하는잡음추정부, 둘이상의프레임으로구성된잡음이부가된오염된음성신호의인접프레임간의상관도를산출하는확률산출부및 오염된음성신호의인접프레임간의상관도및 추정된잡음특징정보를고려하여추출된음성신호특징정보의잡음특징을제거하여상기보상된음성특징을생성하는음성특징보상부를포함한다.
Abstract translation: 本发明涉及一种在嘈杂环境中进行语音识别的特征补偿装置和方法。 根据本发明的用于噪声环境中的语音识别的特征补偿装置包括:特征提取单元,从已经添加了由两个或更多个帧组成的噪声的污染语音信号中提取语音信号特征信息; 噪声估计单元,其基于所提取的语音信号特征信息和经补偿的语音特征来估计噪声特征信息; 计算与由两个以上的帧组成的噪声相邻的污染语音信号相邻的帧之间的相关性的概率计算单元; 以及语音特征补偿单元,其通过考虑与污染的语音信号相邻的帧与估计的噪声特征信息之间的相关性,从提取的语音信号特征信息中去除噪声特征来生成补偿的语音特征。
-
公开(公告)号:KR1020110110044A
公开(公告)日:2011-10-06
申请号:KR1020110029340
申请日:2011-03-31
Applicant: 한국전자통신연구원
IPC: G10L19/005 , G10L19/02 , G10L19/032
CPC classification number: G10L19/0212 , G10L19/0017 , G10L19/032 , G10L19/24 , G10L19/002 , G10L19/005 , G10L19/02 , G10L19/025 , G10L19/06 , G10L19/08 , G10L19/12 , G10L19/125 , G10L19/22
Abstract: 부호화기의 부호화 방법이 제공된다. 부호화기는 입력 신호를 변환하여 제1 MDCT 계수를 생성하고, 제1 MDCT 계수를 양자화하여 MDCT 인덱스를 생성한다. 부호화기는 MDCT 인덱스를 역 양자화하여 제2 MDCT 계수를 생성하고, 제1 MDCT 계수와 제2 MDCT 계수의 차로 MDCT 오류 계수를 계산한다. 다음 부호화기는 MDCT 오류 계수를 부호화하여 오류 인덱스를 생성하고, 제1 MDCT 계수와 제2 MDCT 계수로부터 제1 MDCT 계수의 이득에 대응하는 이득 인덱스를 생성한다.
-
公开(公告)号:KR1020100012788A
公开(公告)日:2010-02-08
申请号:KR1020080131712
申请日:2008-12-22
Applicant: 한국전자통신연구원
Abstract: PURPOSE: A post-processing method in an MDCT(Modified Discrete Cosine Transform) domain and an apparatus thereof are provided to apply a coefficient to an MDCT coefficient after obtaining a post-processing filter coefficient, thereby improving sound quality. CONSTITUTION: A sub band determining unit(110) forms a plurality of sub bands. A band determining unit(120) forms a plurality of bands by integrating the sub bands. A shaping ratio determining unit(140) determines athe shaping ratio about of an input frame. A band filter coefficient determining unit determines the first and second post-processing filter coefficients.
Abstract translation: 目的:提供一种MDCT(改进离散余弦变换)域中的后处理方法及其装置,用于在获得后处理滤波器系数之后将系数应用于MDCT系数,从而提高声音质量。 构成:子带确定单元(110)形成多个子带。 频带确定单元(120)通过对子频带进行积分而形成多个频带。 成形比确定单元(140)确定关于输入帧的成形比。 频带滤波器系数确定单元确定第一和第二后处理滤波器系数。
-
59.
公开(公告)号:KR100554164B1
公开(公告)日:2006-02-22
申请号:KR1020030047455
申请日:2003-07-11
CPC classification number: G10L19/173 , G10L19/12
Abstract: 서로 다른 CELP 방식의 음성 코덱 간의 상호부호화 장치 및 그 방법이 개시된다. 본 발명에 따른 서로 다른 CELP 방식의 음성 코덱 간의 상호부호화 장치는 서로 다른 포맷을 갖는 입력 CELP 코덱과 출력 CELP 코덱 사이에서, 입력 CELP 코덱의 포맷을 출력 CELP 코덱의 포맷으로 변환하는 본 발명에 따른 상호부호화 장치는 입력 CELP 코덱 포맷으로 부호화된 비트스트림를 음성 신호로 변환하는 입력 CELP 코덱의 복호화 처리부, 기준필터를 기준으로, 스펙트럼 왜곡이 최소가 되는 최적의 가중치를 적용하여 계산되는 필터 특성으로 입력 CELP 코덱의 복호화 처리부에서 복호화된 음성신호를 필터 처리하는 상호부호화 필터, 다수의 가중치로 이루어진 가중치 세트로부터 상호부호화 필터의 스펙트럼 왜곡을 최소화하는 최적의 가중치를 추출하여 상호부호화 필터로 제공하는 상호부호화 필터 설계부 및 상호부호화 필터에서 필터 처리된 음성신호를 부호화하여 출력 CELP 코덱 포맷의 비트스트림를 생성하는 출력 CELP 코덱의 부호화 처리부를 포함하는 것을 특징으로 하고, 하나의 상호부호화 필터를 이용하여 종래의 후-필터 및 지각가중필터를 대신함으로써, 상호부호화기의 연산량을 감소시키면서도 수신단에서 복호화된 음성의 음질을 향상시킬 수 있다.
-
公开(公告)号:KR100550003B1
公开(公告)日:2006-02-08
申请号:KR1020030047454
申请日:2003-07-11
Abstract: 상호부호화기에서 개회로 피치 추정 방법 및 그 장치가 개시된다. 서로 다른 CELP 방식의 음성 코덱 간의 상호부호화를 위한 상호부호화기에서 본 발명에 따른 개회로 피치 추정 방법은, 입력 CELP 코덱 포맷으로 부호화된 비트스트림를 음성 신호로 복호화하고, 복호화된 음성신호의 각 부-프레임에 대한 폐-루프 피치를 추출하는 (a)단계, 복호화된 음성 신호를 사람의 청각기관 특성을 고려한 지각가중필터 처리를 하는 (b)단계, 복호화된 폐-루프 피치와, 이전 프레임의 마지막 부-프레임에 대한 폐-루프 피치 또는 동일 프레임에 대한 이전 개-루프 피치를 이용하여 결정된 개-루프 피치 검색 범위에서 지각가중필터링된 음성신호의 개-루프 피치를 검색하는 (c)단계 및 검색된 개-루프 피치를 이용하여 결정된 폐-루프 피치 검색 범위에서 지각가중 필터링된 음성신호의 폐-루프 피치를 검색하고, 검색된 결과를 출력 CELP 코덱 포맷의 피치 지연값으로서 생성하는 (d)단계를 포함하는 것을 특징으로 하며, 기존 재-검색 방식보다 음질 저하를 줄일 수 있으며, 계산량 감소 효과를 얻을 수 있다.
-
-
-
-
-
-
-
-
-