-
1.
公开(公告)号:KR20210035042A
公开(公告)日:2021-03-31
申请号:KR1020200109402A
申请日:2020-08-28
Applicant: 한국전자통신연구원 , 연세대학교 산학협력단
Abstract: 감정 간의 강도 조절이 가능한 감정 음성 생성 방법 및 장치이 개시된다. 감정 음성 생성 방법은 동일한 감정을 표현하는 가중치 벡터들을 그룹화하여 감정 군집들을 생성하는 단계; 동일한 감정 군집에 포함된 가중치 벡터들 간의 거리인 내부 거리를 결정하는 단계; 서로 다른 감정 군집에 포함된 가중치 벡터들 간의 거리인 외부 거리를 결정하는 단계; 상기 내부 거리 및 상기 외부 거리에 기초하여 상기 감정 군집들 각각의 대표 가중치 벡터를 결정하는 단계; 감정을 표현하기 위한 운율의 정보가 포함된 스타일 토큰에 상기 감정 군집의 대표 가중치 벡터를 적용하여 스타일 임베딩을 생성하는 단계; 및 상기 스타일 임베딩을 이용하여 감정을 나타내는 감정 음성을 생성하는 단계를 포함할 수 있다.
-
公开(公告)号:KR100651712B1
公开(公告)日:2006-11-30
申请号:KR1020030046861
申请日:2003-07-10
IPC: G10L19/12
CPC classification number: G10L19/125
Abstract: 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기 및 그 방법이 개시된다. 본 발명에 따른 광대역 음성 부호화기는 부호화할 광대역 음성신호의 개회로 피치값과 선형예측계수를 이용하여 현재 프레임에 해당하는 음성의 특성을 규정하는 음성 특성 분류부, 적응 코드북을 검색하여 적응 코드북 피치 지연값 및 적응 코드북 피치 이득값을 얻고, 1차 고정 코드북 목적신호를 생성하는 적응 코드북 검색부, 1차 고정 코드북을 검색하여 1차 고정 코드북 인덱스와 1차 고정 코드북 이득값을 얻고, 2차 고정 코드북 목적신호를 생성하는 1차 고정 코드북 검색부, 음성 특성에 따라 적어도 둘 이상의 2차 고정 코드북들을 구비하며, 음성 특성 정보에 따라 하나의 2차 고정 코드북을 선택 및 검색하여 2차 고정 코드북 인덱스들과 2차 고정 코드북 이득값들 검색하는 2차 고정코드북 검색부 및 각 부에서 얻어지는 파라미터들을 양자화 및 다중화하여 비트열로 만들어 외부의 음성 복호화단으로 전송하는 파라미터 다중화부를 포함하는 것을 특징으로 하며, 음성 특성에 따라 2개 이상으로 구성된 2차 고정 코드북들로부터 음성 특성에 적합한 2차 고정 코드북을 선택함으로써 광대역 음성신호에 대해 보다 우수한 음질을 제공할 수 있다.
-
公开(公告)号:KR1020050066996A
公开(公告)日:2005-06-30
申请号:KR1020040097916
申请日:2004-11-26
Abstract: 본 발명은 입력 음성 신호의 특성에 따라 입력 음성 신호의 등급을 분류하고 분류한 등급에 대응하는 프레임 크기, 양자화기 구조 및 비트 할당 구조를 사용하여 부호화를 수행하거나, 네트워크의 상태 또는 통화 상대방이 사용하는 음성 부호화기의 종류에 따라 프레임 크기를 조정할 수 있는 음성 부호화/복호화 장치 및 그 방법에 관한 것이다. 본 발명은 입력 음성의 특성에 따라 프레임의 크기와 양자화기 구조 및 비트 할당을 최적으로 조정하여 음성 부호화 장치의 성능을 향상 시킬 수 있으며, 통화 상대방이 사용하는 음성 부호화기의 종류에 따라 프레임의 크기를 조정함으로써 전체 통화 지연을 줄일 수 있다.
-
公开(公告)号:KR100465318B1
公开(公告)日:2005-01-13
申请号:KR1020020081663
申请日:2002-12-20
CPC classification number: H04L12/66
Abstract: A system for transmitting and receiving a wideband speech signal includes an A/D converter for receiving an analog speech signal to convert it into a digital speech signal, encoding a difference between a baseband speech signal and a standard baseband between a synthesized standard baseband signal, and an IP network interface for multiplexing the coded standard and additional baseband signals and enhancement residual band signal.
Abstract translation: 一种用于发送和接收宽带语音信号的系统包括:A / D转换器,用于接收模拟语音信号以将其转换为数字语音信号;在合成的标准基带信号与标准基带信号之间对基带语音信号与标准基带之间的差进行编码; 以及用于多路复用编码标准和附加基带信号以及增强残余频带信号的IP网络接口。
-
公开(公告)号:KR100651731B1
公开(公告)日:2006-12-01
申请号:KR1020040097916
申请日:2004-11-26
Abstract: 본 발명은 입력 음성 신호의 특성에 따라 입력 음성 신호의 등급을 분류하고 분류한 등급에 대응하는 프레임 크기, 양자화기 구조 및 비트 할당 구조를 사용하여 부호화를 수행하거나, 네트워크의 상태 또는 통화 상대방이 사용하는 음성 부호화기의 종류에 따라 프레임 크기를 조정할 수 있는 음성 부호화/복호화 장치 및 그 방법에 관한 것이다. 본 발명은 입력 음성의 특성에 따라 프레임의 크기와 양자화기 구조 및 비트 할당을 최적으로 조정하여 음성 부호화 장치의 성능을 향상 시킬 수 있으며, 통화 상대방이 사용하는 음성 부호화기의 종류에 따라 프레임의 크기를 조정함으로써 전체 통화 지연을 줄일 수 있다.
-
公开(公告)号:KR1020050007853A
公开(公告)日:2005-01-21
申请号:KR1020030047454
申请日:2003-07-11
Abstract: PURPOSE: An apparatus and a method for estimating an open-loop pitch are provided to reduce quantity of calculation and improve quality of sound in a transcoder between speech codecs of different CELP(Code Excited Linear Prediction) types. CONSTITUTION: A decoding process part(401) decodes a coded bitstream having an input CELP codec format and extracts a closed-loop pitch for each sub-frame of a decoded speech signal from the bitstream. A perception weighting filter(402) performs filtering by perception weighting in view of the decoded speech signal. An open-loop pitch search part(407) searches an open-loop pitch within a search range of the open-loop pitch. The search range is determined by using a decoded closed-loop pitch and a previous open-loop pitch of the same frame. A closed-loop pitch search part(408) searches the closed-loop pitch of a speech signal filtered by perception weighting, by utilizing the searched open-loop pitch, and outputs the searched result as a pitch delay value of an output CELP codec format.
Abstract translation: 目的:提供一种用于估计开环音调的装置和方法,以减少不同CELP(代码激励线性预测)类型的语音编解码器之间的代码转换器中的计算量并提高声音质量。 构成:解码处理部分(401)解码具有输入CELP编解码器格式的编码比特流,并从比特流提取解码语音信号的每个子帧的闭环音调。 感知加权滤波器(402)鉴于解码的语音信号,通过感知加权来执行滤波。 开环音调搜索部分(407)搜索开环音调的搜索范围内的开环音调。 通过使用解码的闭环间距和相同帧的先前开环间距来确定搜索范围。 闭环音调搜索部分(408)通过利用搜索到的开环音调搜索通过感知加权滤波的语音信号的闭环音调,并将搜索结果输出为输出CELP编解码器格式的音调延迟值 。
-
7.
公开(公告)号:KR100554164B1
公开(公告)日:2006-02-22
申请号:KR1020030047455
申请日:2003-07-11
CPC classification number: G10L19/173 , G10L19/12
Abstract: 서로 다른 CELP 방식의 음성 코덱 간의 상호부호화 장치 및 그 방법이 개시된다. 본 발명에 따른 서로 다른 CELP 방식의 음성 코덱 간의 상호부호화 장치는 서로 다른 포맷을 갖는 입력 CELP 코덱과 출력 CELP 코덱 사이에서, 입력 CELP 코덱의 포맷을 출력 CELP 코덱의 포맷으로 변환하는 본 발명에 따른 상호부호화 장치는 입력 CELP 코덱 포맷으로 부호화된 비트스트림를 음성 신호로 변환하는 입력 CELP 코덱의 복호화 처리부, 기준필터를 기준으로, 스펙트럼 왜곡이 최소가 되는 최적의 가중치를 적용하여 계산되는 필터 특성으로 입력 CELP 코덱의 복호화 처리부에서 복호화된 음성신호를 필터 처리하는 상호부호화 필터, 다수의 가중치로 이루어진 가중치 세트로부터 상호부호화 필터의 스펙트럼 왜곡을 최소화하는 최적의 가중치를 추출하여 상호부호화 필터로 제공하는 상호부호화 필터 설계부 및 상호부호화 필터에서 필터 처리된 음성신호를 부호화하여 출력 CELP 코덱 포맷의 비트스트림를 생성하는 출력 CELP 코덱의 부호화 처리부를 포함하는 것을 특징으로 하고, 하나의 상호부호화 필터를 이용하여 종래의 후-필터 및 지각가중필터를 대신함으로써, 상호부호화기의 연산량을 감소시키면서도 수신단에서 복호화된 음성의 음질을 향상시킬 수 있다.
-
公开(公告)号:KR100550003B1
公开(公告)日:2006-02-08
申请号:KR1020030047454
申请日:2003-07-11
Abstract: 상호부호화기에서 개회로 피치 추정 방법 및 그 장치가 개시된다. 서로 다른 CELP 방식의 음성 코덱 간의 상호부호화를 위한 상호부호화기에서 본 발명에 따른 개회로 피치 추정 방법은, 입력 CELP 코덱 포맷으로 부호화된 비트스트림를 음성 신호로 복호화하고, 복호화된 음성신호의 각 부-프레임에 대한 폐-루프 피치를 추출하는 (a)단계, 복호화된 음성 신호를 사람의 청각기관 특성을 고려한 지각가중필터 처리를 하는 (b)단계, 복호화된 폐-루프 피치와, 이전 프레임의 마지막 부-프레임에 대한 폐-루프 피치 또는 동일 프레임에 대한 이전 개-루프 피치를 이용하여 결정된 개-루프 피치 검색 범위에서 지각가중필터링된 음성신호의 개-루프 피치를 검색하는 (c)단계 및 검색된 개-루프 피치를 이용하여 결정된 폐-루프 피치 검색 범위에서 지각가중 필터링된 음성신호의 폐-루프 피치를 검색하고, 검색된 결과를 출력 CELP 코덱 포맷의 피치 지연값으로서 생성하는 (d)단계를 포함하는 것을 특징으로 하며, 기존 재-검색 방식보다 음질 저하를 줄일 수 있으며, 계산량 감소 효과를 얻을 수 있다.
-
公开(公告)号:KR1020040050811A
公开(公告)日:2004-06-17
申请号:KR1020020077996
申请日:2002-12-09
IPC: G10L19/002 , G10L19/02 , G10L19/04
CPC classification number: G10L19/24 , G10L21/038
Abstract: PURPOSE: A transceiver for encoding and decoding voice using an additional bit assignment method is provided to offer a high-quality voice service by assigning only additional bits admitted in a system using a voice encoder used in an old voice processing system. CONSTITUTION: A standard voice encoding unit(102) classifies an inputted voice signal into spectrum information indicating a vocal tract transfer function and an excitation signal component, and models and quantizes spectrum information and the excitation signal component. The standard voice encoding unit(102) performs the standard encoding of the quantized signal, and generates a standard-encoded bit series. A quality improvement encoding unit(103) obtains an error between a signal in which spectrum information is not quantized and a signal in which spectrum information is quantized by the standard voice encoding unit(102). The quality improvement encoding unit(103) obtains an error between a signal in which the excitation signal component is not quantized and a signal in which the excitation signal component is quantized. The quality improvement encoding unit(103) additionally quantizes the obtained errors, and generates an encoded bit series. A multiplexing unit(104) multiplexes the bit series obtained in the standard voice encoding unit(102) and the quality improvement encoding unit(103), and transmits the multiplexed bit series.
Abstract translation: 目的:提供一种用于使用附加位分配方法对语音进行编码和解码的收发器,以通过仅使用在旧语音处理系统中使用的语音编码器仅分配系统中允许的附加比特来提供高质量语音服务。 构成:标准语音编码单元(102)将输入的语音信号分类为指示声道传递函数和激励信号分量的频谱信息,并对频谱信息和激励信号分量进行建模和量化。 标准语音编码单元(102)执行量化信号的标准编码,并生成标准编码比特序列。 质量改进编码单元(103)获得频谱信息未被量化的信号与频谱信息由标准语音编码单元(102)量化的信号之间的误差。 质量改进编码单元(103)获得其中激励信号分量未被量化的信号与激励信号分量被量化的信号之间的误差。 质量改进编码单元(103)另外量化所获得的误差,并生成编码比特序列。 复用单元(104)复用在标准语音编码单元(102)和质量改进编码单元(103)中获得的比特序列,并且发送多路复用的比特序列。
-
公开(公告)号:KR100467326B1
公开(公告)日:2005-01-24
申请号:KR1020020077996
申请日:2002-12-09
IPC: G10L19/002 , G10L19/02 , G10L19/04
CPC classification number: G10L19/24 , G10L21/038
Abstract: The present invention relates to a transmitter and a receiver for speech coding and decoding by using an additional bit allocation method. The transmitter and the receiver according to the present invention realize a voice communication service of high quality by using additional bits permitted in system requirements while using a conventional speech coder as it is. In addition, the transmitter and the receiver according to the present invention have an advantage in that they enable insertion of additional quantization blocks while not changing the structure of the conventional standard speech coder, since they allocate additional bits by applying a multi-stage quantization procedure not in a speech signal domain but in a parameter domain.
Abstract translation: 本发明涉及通过使用附加比特分配方法进行语音编码和解码的发射机和接收机。 根据本发明的发射机和接收机通过使用系统要求中允许的附加比特来实现高质量的语音通信服务,同时使用常规的语音编码器。 另外,根据本发明的发射机和接收机具有这样的优点,即它们能够插入额外的量化块,而不改变常规标准语音编码器的结构,因为它们通过应用多级量化过程来分配附加比特 不在语音信号域中,而是在参数域中。
-
-
-
-
-
-
-
-
-