-
公开(公告)号:KR100651712B1
公开(公告)日:2006-11-30
申请号:KR1020030046861
申请日:2003-07-10
IPC: G10L19/12
CPC classification number: G10L19/125
Abstract: 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기 및 그 방법이 개시된다. 본 발명에 따른 광대역 음성 부호화기는 부호화할 광대역 음성신호의 개회로 피치값과 선형예측계수를 이용하여 현재 프레임에 해당하는 음성의 특성을 규정하는 음성 특성 분류부, 적응 코드북을 검색하여 적응 코드북 피치 지연값 및 적응 코드북 피치 이득값을 얻고, 1차 고정 코드북 목적신호를 생성하는 적응 코드북 검색부, 1차 고정 코드북을 검색하여 1차 고정 코드북 인덱스와 1차 고정 코드북 이득값을 얻고, 2차 고정 코드북 목적신호를 생성하는 1차 고정 코드북 검색부, 음성 특성에 따라 적어도 둘 이상의 2차 고정 코드북들을 구비하며, 음성 특성 정보에 따라 하나의 2차 고정 코드북을 선택 및 검색하여 2차 고정 코드북 인덱스들과 2차 고정 코드북 이득값들 검색하는 2차 고정코드북 검색부 및 각 부에서 얻어지는 파라미터들을 양자화 및 다중화하여 비트열로 만들어 외부의 음성 복호화단으로 전송하는 파라미터 다중화부를 포함하는 것을 특징으로 하며, 음성 특성에 따라 2개 이상으로 구성된 2차 고정 코드북들로부터 음성 특성에 적합한 2차 고정 코드북을 선택함으로써 광대역 음성신호에 대해 보다 우수한 음질을 제공할 수 있다.
-
公开(公告)号:KR100563316B1
公开(公告)日:2006-03-27
申请号:KR1020040043158
申请日:2004-06-11
Applicant: 학교법인연세대학교
Abstract: 본 발명의 목적을 달성하기 위한 보완적 특징벡터를 이용한 화자특징벡터 생성방법 및 장치에 관한 것으로서, 본 발명의 목적은 입력된 화자 음성신호에서 특징벡터를 추출하여 화자모델링 훈련 및 화자인식을 수행하는 화자인식시스템에 있어서, 상기 입력된 음성신호에 목적화자와 사칭화자에 따라 서로 다른 제한된 환경의 보완적 특징을 첨가하는 보완특징첨가수단과, 상기 보완특징첨가수단을 통해 보완적 특징이 첨가된 음성신호의 특징벡터를 추출하는 특징벡터생성수단을 포함하여 구성된 것을 특징으로 한다.
화자, 목적화자, 사칭화자, 음성, 인식, 특징, 벡터, 추출, 생성, 보완, 제한적 환경-
公开(公告)号:KR1020050117887A
公开(公告)日:2005-12-15
申请号:KR1020040043158
申请日:2004-06-11
Applicant: 학교법인연세대학교
Abstract: 본 발명의 목적을 달성하기 위한 보완적 특징벡터를 이용한 화자특징벡터 생성방법 및 장치에 관한 것으로서, 본 발명의 목적은 입력된 화자 음성신호에서 특징벡터를 추출하여 화자모델링 훈련 및 화자인식을 수행하는 화자인식시스템에 있어서, 상기 입력된 음성신호에 목적화자와 사칭화자에 따라 서로 다른 제한된 환경의 보완적 특징을 첨가하는 보완특징첨가수단과, 상기 보완특징첨가수단을 통해 보완적 특징이 첨가된 음성신호의 특징벡터를 추출하는 특징벡터생성수단을 포함하여 구성된 것을 특징으로 한다.
-
公开(公告)号:KR1020050066996A
公开(公告)日:2005-06-30
申请号:KR1020040097916
申请日:2004-11-26
Abstract: 본 발명은 입력 음성 신호의 특성에 따라 입력 음성 신호의 등급을 분류하고 분류한 등급에 대응하는 프레임 크기, 양자화기 구조 및 비트 할당 구조를 사용하여 부호화를 수행하거나, 네트워크의 상태 또는 통화 상대방이 사용하는 음성 부호화기의 종류에 따라 프레임 크기를 조정할 수 있는 음성 부호화/복호화 장치 및 그 방법에 관한 것이다. 본 발명은 입력 음성의 특성에 따라 프레임의 크기와 양자화기 구조 및 비트 할당을 최적으로 조정하여 음성 부호화 장치의 성능을 향상 시킬 수 있으며, 통화 상대방이 사용하는 음성 부호화기의 종류에 따라 프레임의 크기를 조정함으로써 전체 통화 지연을 줄일 수 있다.
-
公开(公告)号:KR100465318B1
公开(公告)日:2005-01-13
申请号:KR1020020081663
申请日:2002-12-20
CPC classification number: H04L12/66
Abstract: A system for transmitting and receiving a wideband speech signal includes an A/D converter for receiving an analog speech signal to convert it into a digital speech signal, encoding a difference between a baseband speech signal and a standard baseband between a synthesized standard baseband signal, and an IP network interface for multiplexing the coded standard and additional baseband signals and enhancement residual band signal.
Abstract translation: 一种用于发送和接收宽带语音信号的系统包括:A / D转换器,用于接收模拟语音信号以将其转换为数字语音信号;在合成的标准基带信号与标准基带信号之间对基带语音信号与标准基带之间的差进行编码; 以及用于多路复用编码标准和附加基带信号以及增强残余频带信号的IP网络接口。
-
公开(公告)号:KR100651731B1
公开(公告)日:2006-12-01
申请号:KR1020040097916
申请日:2004-11-26
Abstract: 본 발명은 입력 음성 신호의 특성에 따라 입력 음성 신호의 등급을 분류하고 분류한 등급에 대응하는 프레임 크기, 양자화기 구조 및 비트 할당 구조를 사용하여 부호화를 수행하거나, 네트워크의 상태 또는 통화 상대방이 사용하는 음성 부호화기의 종류에 따라 프레임 크기를 조정할 수 있는 음성 부호화/복호화 장치 및 그 방법에 관한 것이다. 본 발명은 입력 음성의 특성에 따라 프레임의 크기와 양자화기 구조 및 비트 할당을 최적으로 조정하여 음성 부호화 장치의 성능을 향상 시킬 수 있으며, 통화 상대방이 사용하는 음성 부호화기의 종류에 따라 프레임의 크기를 조정함으로써 전체 통화 지연을 줄일 수 있다.
-
公开(公告)号:KR100526110B1
公开(公告)日:2005-11-08
申请号:KR1020030082086
申请日:2003-11-19
Applicant: 학교법인연세대학교
Abstract: 본 발명은 화자인식시스템의 화자 특징벡터 생성방법 및 시스템에 관한 것으로서, 입력된 화자 음성신호에서 특징벡터를 추출하여 화자모델링 훈련 및 화자인식을 수행하는 화자인식시스템에 있어서, 입력된 화자음성신호의 피치간격을 측정하고 소정의 피치구간 음성신호를 추출하는 피치구간 음성추출수단, 피치구간음성추출수단에서 추출된 음성신호의 특징벡터를 생성하는 특징벡터생성수단을 포함하여 이루어진 것을 특징으로 한다.
-
公开(公告)号:KR100596558B1
公开(公告)日:2006-07-05
申请号:KR1020040071329
申请日:2004-09-07
Applicant: 학교법인연세대학교
Abstract: 본 발명은 음성을 이용한 화자 인식 시스템에서 기존에 사용하는 특징 벡터를 특정한 변환 행렬을 사용하여 성능을 더 향상시킬 수 있는 모델을 만드는 방법에 관한 것으로서, 화자 인식 시스템에 사용될 수 있는 특징벡터를 변환 행렬을 이용해 변환한 후 화자 모델을 만들게 되면 화자 인식 시스템의 성능을 향상시킬 수 있는 것을 특징으로 한다.
화자, 음성, 인식, 변환, 행렬, 특징-
公开(公告)号:KR1020050007853A
公开(公告)日:2005-01-21
申请号:KR1020030047454
申请日:2003-07-11
Abstract: PURPOSE: An apparatus and a method for estimating an open-loop pitch are provided to reduce quantity of calculation and improve quality of sound in a transcoder between speech codecs of different CELP(Code Excited Linear Prediction) types. CONSTITUTION: A decoding process part(401) decodes a coded bitstream having an input CELP codec format and extracts a closed-loop pitch for each sub-frame of a decoded speech signal from the bitstream. A perception weighting filter(402) performs filtering by perception weighting in view of the decoded speech signal. An open-loop pitch search part(407) searches an open-loop pitch within a search range of the open-loop pitch. The search range is determined by using a decoded closed-loop pitch and a previous open-loop pitch of the same frame. A closed-loop pitch search part(408) searches the closed-loop pitch of a speech signal filtered by perception weighting, by utilizing the searched open-loop pitch, and outputs the searched result as a pitch delay value of an output CELP codec format.
Abstract translation: 目的:提供一种用于估计开环音调的装置和方法,以减少不同CELP(代码激励线性预测)类型的语音编解码器之间的代码转换器中的计算量并提高声音质量。 构成:解码处理部分(401)解码具有输入CELP编解码器格式的编码比特流,并从比特流提取解码语音信号的每个子帧的闭环音调。 感知加权滤波器(402)鉴于解码的语音信号,通过感知加权来执行滤波。 开环音调搜索部分(407)搜索开环音调的搜索范围内的开环音调。 通过使用解码的闭环间距和相同帧的先前开环间距来确定搜索范围。 闭环音调搜索部分(408)通过利用搜索到的开环音调搜索通过感知加权滤波的语音信号的闭环音调,并将搜索结果输出为输出CELP编解码器格式的音调延迟值 。
-
公开(公告)号:KR1020060022492A
公开(公告)日:2006-03-10
申请号:KR1020040071329
申请日:2004-09-07
Applicant: 학교법인연세대학교
Abstract: 본 발명은 음성을 이용한 화자 인식 시스템에서 기존에 사용하는 특징 벡터를 특정한 변환 행렬을 사용하여 성능을 더 향상시킬 수 있는 모델을 만드는 방법에 관한 것으로서, 화자 인식 시스템에 사용될 수 있는 특징벡터를 변환 행렬을 이용해 변환한 후 화자 모델을 만들게 되면 화자 인식 시스템의 성능을 향상시킬 수 있는 것을 특징으로 한다.
화자, 음성, 인식, 변환, 행렬, 특징
-
-
-
-
-
-
-
-
-