-
公开(公告)号:KR1020080099740A
公开(公告)日:2008-11-13
申请号:KR1020070045691
申请日:2007-05-10
Abstract: A gender recognizing method based on a audio signal and an apparatus thereof are provided to extract a feature vector in which a voiceless sound is removed and compare the feature vector with a Gaussian mixture model and a voiced sound, thereby increasing accuracy of recognizing gender. A Gaussian mixture model in which a voiceless sound is removed with regard to a plurality of audio signals is generated(S100). An audio signal of a speaker is received(S200). A feature vector in which a voiceless sound is removed with regard to the audio signal is extracted(S300). The gender of the audio signal is determined by comparing the extracted feature vector with the Gaussian mixture model.
Abstract translation: 提供一种基于音频信号的性别识别方法及其装置,以提取其中除去无声音的特征向量,并将特征向量与高斯混合模型和浊音进行比较,从而提高识别性别的准确性。 产生其中关于多个音频信号去除无声音的高斯混合模型(S100)。 接收扬声器的音频信号(S200)。 提取其中关于音频信号去除无声音的特征向量(S300)。 通过将提取的特征向量与高斯混合模型进行比较来确定音频信号的性别。
-
公开(公告)号:KR100513175B1
公开(公告)日:2005-09-07
申请号:KR1020020083728
申请日:2002-12-24
Applicant: 한국전자통신연구원
IPC: G10L15/14
CPC classification number: G10L25/78
Abstract: 본 발명은 복소수 라플라시안 통계 모델을 이용한 음성 검출기에 관한 것이다. 본 발명의 음성검출기는 입력된 음성에 대하여 고속 푸리에 변환을 수행하여 시간 영역의 음성신호를 주파수 영역에서 분석할 수 있도록 하는 고속 주파수 푸리에 변환기, 상기 고속 주파수 푸리에 변환기로부터 출력되는 주파수 영역 상의 잡음에 오염된 음성으로부터 잡음 신호의 파워를 추정하는 잡음 파워 추정부, 상기 추정된 잡음 신호의 파워에 기초하여 음성의 존재와 비존재에 대한 복소 라플라시안 확률 통계 모델로부터 주파수 영역에 대해 가능성 비율을 결정하고, 상기 결정된 가능성 비율로부터 VAD(Voice activity detection)의 결정 규칙을 계산하는 가능성 비율 테스트(LRT) 계산부를 포함한다.
-