-
公开(公告)号:KR20210030886A
公开(公告)日:2021-03-18
申请号:KR1020200115530A
申请日:2020-09-09
Applicant: 한국전자통신연구원
IPC: G10L19/032 , G06N3/08
CPC classification number: G10L19/032 , G06N3/08
Abstract: 동적 모델 파라미터를 이용한 오디오 부호화 방법 및 오디오 복호화 방법, 오디오 부호화 장치 및 오디오 복호화 장치가 개시된다. 동적 모델 파라미터를 이용한 오디오 부호화 방법은 부호화 네트워크에서 오디오 신호의 차원을 축소할 때 레벨들 각각에 대응하는 동적 모델 파라미터를 이용할 수 있다. 그리고, 동적 모델 파라미터를 이용한 오디오 복호화 방법은 부호화 네트워크에서 오디오 신호의 차원을 확장할 때 레벨들 각각에 대응하는 동적 모델 파라미터를 이용할 수 있다.
-
公开(公告)号:WO2017164606A3
公开(公告)日:2017-09-28
申请号:PCT/KR2017/002995
申请日:2017-03-21
Applicant: 한국전자통신연구원
IPC: H04N19/11 , G10L19/005 , G10L19/04 , H04N19/176
Abstract: 블록 기반의 오디오 부호화/복호화 장치 및 그 방법이 개시된다. 오디오 신호의 부호화 방법은 오디오 신호를 구성하는 입력 프레임들 각각을 복수의 서브 프레임들로 분할하는 단계; 상기 서브 프레임들을 주파수 영역으로 변환하는 단계; 주파수 영역으로 변환된 서브 프레임들을 이용하여 2D 인트라(intra)블록을 형성하는 단계; 및 상기 2D 인트라 블록을 부호화하는 단계를 포함하고, 상기 2D 인트라 블록은, 상기 주파수 영역으로 변환된 서브 프레임들의 주파수 계수를 시간과 주파수를 이용하여 2차원으로 표시한 블록일 수 있다.
-
公开(公告)号:WO2017164606A2
公开(公告)日:2017-09-28
申请号:PCT/KR2017/002995
申请日:2017-03-21
Applicant: 한국전자통신연구원
IPC: H04N19/11 , G10L19/005 , G10L19/04 , H04N19/176
CPC classification number: G10L19/022 , G10L19/0204 , G10L19/0212 , G10L19/03 , G10L19/032 , G10L19/04 , H04N19/11 , H04N19/176
Abstract: 블록 기반의 오디오 부호화/복호화 장치 및 그 방법이 개시된다. 오디오 신호의 부호화 방법은 오디오 신호를 구성하는 입력 프레임들 각각을 복수의 서브 프레임들로 분할하는 단계; 상기 서브 프레임들을 주파수 영역으로 변환하는 단계; 주파수 영역으로 변환된 서브 프레임들을 이용하여 2D 인트라(intra)블록을 형성하는 단계; 및 상기 2D 인트라 블록을 부호화하는 단계를 포함하고, 상기 2D 인트라 블록은, 상기 주파수 영역으로 변환된 서브 프레임들의 주파수 계수를 시간과 주파수를 이용하여 2차원으로 표시한 블록일 수 있다.
Abstract translation: 公开了一种基于块的音频编码/解码设备及其方法。 一种编码音频信号的方法包括:将构成音频信号的每个输入帧分成多个子帧; 将子帧变换到频域; 使用变换成频域的子帧来形成2D帧内块; 并且对2D内部块进行编码2D内部块可以是使用时间和频率以二维方式显示转换为频域的子帧的频率系数的块。 P >
-
公开(公告)号:WO2013062370A9
公开(公告)日:2013-05-02
申请号:PCT/KR2012/008893
申请日:2012-10-26
Inventor: 이미숙
Abstract: 본 발명은. 통신 시스템에서 음성 및 오디오 신호를 부호화/복호화하는 코덱(codec) 장치 및 방법에 관한 것으로, 음성 신호에 대한 펄스 인덱스를 이용하여 고정 코드북 여기 신호를 생성하고, 상기 음성 신호에 대한 피치 인덱스를 이용하여 제1적응 코드북 여기 신호를 생성하고, 상기 고정 코드북 여기 신호에 고정 코드북 이득을 곱하여, 고정 코드북 신호를 생성하고, 상기 제1적응 코드북 여기 신호에 제1적응 코드북 이득을 곱하여, 제1적응 코드북 신호를 생성하며, 상기 고정 코드북 신호와 상기 제1적응 코드북 신호를 합산하여, 합성 필터 여기 신호를 생성한다.
-
公开(公告)号:WO2022010189A1
公开(公告)日:2022-01-13
申请号:PCT/KR2021/008417
申请日:2021-07-02
Applicant: 한국전자통신연구원
IPC: G10L19/00 , G10L19/005 , G10L19/16
Abstract: 천이구간 부호화 왜곡에 강인한 오디오 부호화/복호화 장치 및 방법이 개시된다. 오디오 부호화 방법은 입력 신호를 T/F(time-to-frequency) 변환하여 주파수 영역 신호를 출력하는 단계; 상기 주파수 영역 신호에 FDNS(frequency domain noise shaping) 부호화를 적용하여 상기 주파수 영역 신호에서 주파수축 포락선이 제거된 주파수 영역 잔차 신호를 출력하는 단계; 상기 주파수 영역 잔차 신호를 기초로 LPC(linear prediction coefficient) 분석을 수행하여 시간축 포락선이 제거된 시간 영역 잔차 신호를 출력하는 단계; 및 상기 시간 영역 잔차 신호를 양자화하여 전송하는 단계를 포함할 수 있다.
-
公开(公告)号:WO2012044066A1
公开(公告)日:2012-04-05
申请号:PCT/KR2011/007147
申请日:2011-09-28
Inventor: 이미숙
IPC: G10L19/00
CPC classification number: G10L19/09
Abstract: 본 발명은 쉐이핑 함수를 이용한 오디오 신호의 디코딩 방법 및 장치에 관한 것이다. 본 발명의 일 실시예에 따른 오디오 신호를 디코딩하는 방법은, 오디오 신호의 프레임 데이터를 입력받는 단계, 랜덤 함수를 이용하여 프레임 데이터의 고정 코드북을 복원하는 단계, 프레임 데이터의 적응 코드북을 이용하여 쉐이핑 함수를 계산하는 단계, 쉐이핑 함수를 이용하여 복원된 고정 코드북을 쉐이핑하는 단계 및 쉐이핑된 고정 코드북 및 적응 코드북을 이용하여, 프레임 데이터로부터 오디오 신호를 합성하는 단계를 포함한다. 본 발명에 의하면 프레임 데이터 손실이 발생했을 경우, 적응 코드북을 기반으로 계산된 쉐이핑 함수를 이용하여 고정 코드북을 복원함으로써, 피치 주기를 강조하고 피치 주기 사이의 고정 코드북 영향을 줄여 합성된 신호의 품질 저하를 줄일 수 있는 효과가 있다.
Abstract translation: 本发明涉及使用整形功能对音频信号进行解码的方法和装置。 根据本发明的一个实施例,用于解码音频信号的方法包括以下步骤:将音频信号的帧数据作为输入; 使用随机函数恢复帧数据的固定码本; 使用所述帧数据的自适应码本计算整形函数; 使用整形功能对恢复的固定码本进行整形; 并使用成形固定码本和自适应码本从帧数据合成音频信号。 根据本发明,可以使用在发生帧数据丢失时基于自适应码本计算的整形函数来恢复固定码本,从而强调音调周期并减少固定码本在音调周期之间的影响 以减少合成信号质量的降低。
-
公开(公告)号:KR1020050066996A
公开(公告)日:2005-06-30
申请号:KR1020040097916
申请日:2004-11-26
Abstract: 본 발명은 입력 음성 신호의 특성에 따라 입력 음성 신호의 등급을 분류하고 분류한 등급에 대응하는 프레임 크기, 양자화기 구조 및 비트 할당 구조를 사용하여 부호화를 수행하거나, 네트워크의 상태 또는 통화 상대방이 사용하는 음성 부호화기의 종류에 따라 프레임 크기를 조정할 수 있는 음성 부호화/복호화 장치 및 그 방법에 관한 것이다. 본 발명은 입력 음성의 특성에 따라 프레임의 크기와 양자화기 구조 및 비트 할당을 최적으로 조정하여 음성 부호화 장치의 성능을 향상 시킬 수 있으며, 통화 상대방이 사용하는 음성 부호화기의 종류에 따라 프레임의 크기를 조정함으로써 전체 통화 지연을 줄일 수 있다.
-
公开(公告)号:KR100651731B1
公开(公告)日:2006-12-01
申请号:KR1020040097916
申请日:2004-11-26
Abstract: 본 발명은 입력 음성 신호의 특성에 따라 입력 음성 신호의 등급을 분류하고 분류한 등급에 대응하는 프레임 크기, 양자화기 구조 및 비트 할당 구조를 사용하여 부호화를 수행하거나, 네트워크의 상태 또는 통화 상대방이 사용하는 음성 부호화기의 종류에 따라 프레임 크기를 조정할 수 있는 음성 부호화/복호화 장치 및 그 방법에 관한 것이다. 본 발명은 입력 음성의 특성에 따라 프레임의 크기와 양자화기 구조 및 비트 할당을 최적으로 조정하여 음성 부호화 장치의 성능을 향상 시킬 수 있으며, 통화 상대방이 사용하는 음성 부호화기의 종류에 따라 프레임의 크기를 조정함으로써 전체 통화 지연을 줄일 수 있다.
-
公开(公告)号:WO2012044067A1
公开(公告)日:2012-04-05
申请号:PCT/KR2011/007150
申请日:2011-09-28
Inventor: 이미숙
IPC: G10L19/00
CPC classification number: G10L19/005 , G10L19/09
Abstract: 본 발명은 적응 코드북 업데이트를 이용한 오디오 신호의 디코딩 방법 및 장치에 관한 것이다. 본 발명의 일 실시예에 따른 오디오 신호를 디코딩하는 방법은, 손실 프레임인 N번째 프레임과 정상 프레임인 N+1번째 프레임을 입력받는 단계, N번째 프레임과 N+1번째 프레임을 이용하여 N번째 프레임의 마지막 서브프레임의 적응 코드북 업데이트 여부를 결정하는 단계, N+1번째 프레임을 이용하여 N번째 프레임의 마지막 서브프레임의 적응 코드북을 업데이트하는 단계 및 N번째 프레임을 이용하여 오디오 신호를 합성하는 단계를 포함한다. 본 발명에 의하면 프레임 데이터 손실이 발생했을 경우, 프레임 데이터 손실 이후에 정상적으로 수신된 프레임 데이터를 이용하여 손실된 프레임의 마지막 서브프레임의 적응 코드북을 업데이트함으로써 보다 빠르게 프레임 손실 전의 상태로 복귀할 수 있는 효과가 있다.
Abstract translation: 本发明涉及一种使用自适应码本更新对音频信号进行解码的方法和装置。 根据本发明的一个实施例,用于解码音频信号的方法包括以下步骤:将作为丢失帧的第N帧和作为正常的第N + 1帧的输入作为输入 帧; 使用第N帧和第N + 1帧来确定是否更新第N帧的最后子帧的自适应码本; 使用第N + 1帧来更新第N帧的最后子帧的自适应码本; 并使用第N帧合成音频信号。 根据本发明,在出现丢帧的数据丢失后,使用正常接收的帧数据来更新丢失帧的最后子帧的自适应码本,从而更快地返回到状态 之前丢失帧数据。
-
公开(公告)号:WO2010134757A3
公开(公告)日:2010-11-25
申请号:PCT/KR2010/003167
申请日:2010-05-19
IPC: G10L19/00
Abstract: 본 발명은 오디오 신호의 인코딩 및 디코딩 방법 및 장치에 관한 것이다. 본 발명의 일 실시예에 의한 오디오 신호의 인코딩 방법은, 변환된 오디오 신호를 입력받는 단계, 변환된 오디오 신호를 복수 개의 서브 대역으로 나누는 단계, 복수 개의 서브 대역에 대하여 제1 정현파 펄스 코딩을 수행하는 단계, 제1 정현파 펄스 코딩의 펄스 코딩 정보를 이용하여, 복수 개의 서브 대역 중 제2 정현파 펄스 코딩의 수행 영역을 결정하는 단계 및 수행 영역에 대하여 제2 정현파 펄스 코딩을 수행하는 단계를 포함하고, 제1 정현파 펄스 코딩 수행 단계는 상기 펄스 코딩 정보에 따라 가변적으로 수행되는 것을 특징으로 한다. 본 발명에 의하면 계층형 정현파 펄스 코딩을 이용하여 상위 계층에서 오디오 신호를 인코딩 또는 디코딩할 때, 하위 계층의 정현파 펄스 코딩을 고려함으로써 합성 신호의 품질을 더욱 향상시킬 수 있는 효과가 있다.
-
-
-
-
-
-
-
-
-