-
公开(公告)号:KR100571574B1
公开(公告)日:2006-04-17
申请号:KR1020040058256
申请日:2004-07-26
Applicant: 한양대학교 산학협력단
CPC classification number: G10L17/02
Abstract: 본 발명은 비선형 분석을 이용한 유사화자 인식방법 및 그 시스템에 관한 것이다. 본 발명은 음성신호에 대한 비선형 분석을 통하여 음성 신호에 존재하는 비선형 특징을 추출하고 스펙트럼과 같은 선형특징과의 조합을 통하여 유사화자인식 문제를 해결하는 것을 목적으로 한다.
본 발명은 화자인식에 음성의 비선형 특징을 이용하는 것을 특징으로 하고, 음성의 비선형 정보를 추출하기 위하여 시간 공간상의 음성 데이터를 위상 공간상의 상태 벡터들로 변환하는 단계와; 상기 재구성된 상태 벡터들의 비선형 특징을 표현할 수 있는 비선형 시계열 분석 방식을 적용하는 단계로 구성된다.
본 발명에 의하면, 기존의 선형 알고리즘의 기술적 한계를 극복할 수 있고, 화자인식시스템 이외의 음성 관련 응용 시스템들에의 기술적 파급 효과가 있다.
화자인식, 비선형분석, 선형분석, 음성신호, 상태 벡터, 포만트Abstract translation: 本发明涉及一种使用非线性分析的类似说话者识别方法及其系统。 本发明旨在通过语音信号的非线性分析来提取语音信号中存在的非线性特征,并通过结合频谱等非线性特征来解决识别类似说话人的问题。
-
公开(公告)号:KR100789084B1
公开(公告)日:2007-12-26
申请号:KR1020060115012
申请日:2006-11-21
Applicant: 한양대학교 산학협력단
IPC: G10L21/0208 , G10L19/02
CPC classification number: G10L21/0208 , G10L25/27
Abstract: A sound quality enhancement method by overweighting gain of a nonlinear structure in a wavelet packet area is provided to restrain the generation of musical noise efficiently and ensure reliable intelligibility in an enhanced voice. A sound quality enhancement method by overweighting gain of a nonlinear structure in a wavelet packet area comprises the following steps of: generating a converting signal that a voice signal polluted by noise is converted by UWPT(Uniform Wavelet Packet Transform); calculating a relative size difference, which is an identifier for calculating a relative difference between the amount of noise existing in a sub band and the amount of a voice polluted by noise; calculating the overweighting gain of the nonlinear structure from the relative size difference; calculating a transformed time-varying gain function based on an LSL(Least-Squares Line) algorithm; and performing spectral subtraction using the transformed time-varying gain function.
Abstract translation: 提供了一种通过在小波包区域中对非线性结构的增益进行加权的音质增强方法,以有效地抑制音乐噪声的产生,并确保增强语音中的可靠性。 通过对小波包区域中的非线性结构的增益进行加权的声音质量增强方法包括以下步骤:产生通过UWPT(均匀小波包变换)将由噪声污染的语音信号转换的转换信号; 计算相对尺寸差,其是用于计算存在于子带中的噪声量与被噪声污染的声音的量之间的相对差的标识符; 从相对尺寸差计算非线性结构的超重增益; 基于LSL(最小二乘法)算法计算变换后变增益函数; 并使用变换的时变增益函数进行频谱减法。
-
公开(公告)号:KR1020060009605A
公开(公告)日:2006-02-01
申请号:KR1020040058256
申请日:2004-07-26
Applicant: 한양대학교 산학협력단
CPC classification number: G10L17/02
Abstract: 본 발명은 비선형 분석을 이용한 유사화자 인식방법 및 그 시스템에 관한 것이다. 본 발명은 음성신호에 대한 비선형 분석을 통하여 음성 신호에 존재하는 비선형 특징을 추출하고 스펙트럼과 같은 선형특징과의 조합을 통하여 유사화자인식 문제를 해결하는 것을 목적으로 한다.
본 발명은 화자인식에 음성의 비선형 특징을 이용하는 것을 특징으로 하고, 음성의 비선형 정보를 추출하기 위하여 시간 공간상의 음성 데이터를 위상 공간상의 상태 벡터들로 변환하는 단계와; 상기 재구성된 상태 벡터들의 비선형 특징을 표현할 수 있는 비선형 시계열 분석 방식을 적용하는 단계로 구성된다.
본 발명에 의하면, 기존의 선형 알고리즘의 기술적 한계를 극복할 수 있고, 화자인식시스템 이외의 음성 관련 응용 시스템들에의 기술적 파급 효과가 있다.
화자인식, 비선형분석, 선형분석, 음성신호, 상태 벡터, 포만트-
公开(公告)号:KR100798056B1
公开(公告)日:2008-01-28
申请号:KR1020060103480
申请日:2006-10-24
Applicant: 한양대학교 산학협력단
IPC: G10L15/20 , G10L21/0208 , G10L21/0216 , G10L19/02
Abstract: A voice processing method for improving sound quality in a highly non-stationary noise environment is provided to adaptively estimate noise by using a size SNR(Signal-to-Noise Ratio) and a determining rule for discriminating whether a current sub-band is close to a voice or noise. A uniform wavelet packet-converted signal is generated with respect to a single interval of a voice signal with noise. An upper relative ratio, a lower relative ratio and a distribution ratio are obtained from a frame of the converted signal. An identifier of a determining rule is calculated by using the three types of ratios. It is successively discriminated whether a sub-band of a frame includes only noise or both noise and a voice by comparing the calculated identifier of the determining rule and a threshold value, a size SNR indicating an amount of noise existing in the sub-band, and noise is estimated by using the size of coefficient of the uniform wavelet packet existing in the sub-band and the size SNR. The estimated noise is subtracted from the voice with a noise to obtain an improved voice signal.
Abstract translation: 提供了一种用于在高度非稳定的噪声环境中改善声音质量的语音处理方法,以通过使用尺寸SNR(信噪比)和用于鉴别当前子带是否接近的确定规则自适应地估计噪声 一个声音或噪音。 相对于具有噪声的语音信号的单个间隔产生统一的小波包转换信号。 从转换信号的帧中获得上相对比,较低相对比和分布比。 通过使用三种类型的比率来计算确定规则的标识符。 通过比较所计算的确定规则的标识符和阈值,指示存在于子带中的噪声量的尺寸SNR,连续地判别帧的子带是仅包括噪声或噪声两者,还包括声音, 并且通过使用存在于子带中的均匀小波包的系数的大小和尺寸SNR来估计噪声。 从具有噪声的语音中减去估计的噪声,以获得改善的语音信号。
-
-
-