-
公开(公告)号:KR100717154B1
公开(公告)日:2007-05-11
申请号:KR1020040116795
申请日:2004-12-30
Applicant: 한국전자통신연구원
Abstract: 본 발명은 멀티채널 오디오 신호를 다운믹스하기 위해 필요한 파워 동일화(power equalization)를 제공하는 방법 및 장치에 관한 것이다.
본 발명의 제1 실시예에서는 주파수 영역을 균등한 대역폭을 갖는 서브밴드로 세분한 후에 서브밴드별로 파워 동일화를 실시한다. 본 발명의 제2 실시예에서는 주파수 영역을 ERB에 따라 서브밴드로 세분하되, 선정된 주파수 미만의 서브밴드는 하나의 서브밴드로 합친 후에 서브밴드별로 파워 동일화를 실시한다.
다운믹스, 파워 동일화(Power Equalization)-
公开(公告)号:KR1020060077832A
公开(公告)日:2006-07-05
申请号:KR1020040117805
申请日:2004-12-31
Applicant: 한국전자통신연구원
IPC: G10L19/008 , G10L19/02
Abstract: 본 발명은 공간정보기반 오디오 부호화(SAC: Spatial Audio Coding) 방식을 이용한 멀티채널 오디오 신호의 부호화 및 복호화하는 과정에서 부가정보로 사용되는 공간정보 (spatial cue)를 추출 및 적용하는 방법에 관한 것이다. 본 발명의 일특징에 따르면, 멀티채널 오디오 신호의 공간정보 오디오 부호화시에 각 서브밴드별 공간 정보를 추출하는 방법이 제공된다. 상기 공간정보 추출 방법은, 좌우 비대칭적이고 동일한 최대치를 지니며 이웃한 창함수와 중첩되는 부분에서 그 합이 일정 상수로 표현되도록 서브밴드별 창함수를 선정하는 단계와, 상기 선정된 창함수를 이용하여 공간정보를 추출하는 단계를 포함하는 것을 특징으로 한다. 일실시예에서, 상기 공간 정보는 채널간 에너지비(Inter-Channel Level Difference: ICLD)이다.
공간정보 기반 오디오 부호화(spatial audio coding:SAC), ICLD(Inter Channel Level Difference)-
公开(公告)号:KR1020060049980A
公开(公告)日:2006-05-19
申请号:KR1020050061655
申请日:2005-07-08
Applicant: 한국전자통신연구원
IPC: H03M7/30
CPC classification number: G10L19/008 , G10L19/02
Abstract: 본 발명은 다채널 오디오 신호를 부호화/복호화 하는 방법 및 장치에 관한 것으로, 보다 상세하게는, 채널 상관성에 기반하여 다채널 오디오 신호를 부호화 및 복호화하는 다채널 파라메트릭 부호화/복호화 방법 및 장치에 관한 것이다.
본 발명에 따른 다채널 오디오 신호 부호화 장치는 다채널 오디오 신호를 주파수 영역에서 분할하는 신호 분할 수단; 상기 분할된 신호를 단일채널로 다운믹스(dowm-mix)하여 부호화하는 다운믹스 수단; 및 상기 분할된 신호에 대해 프레임 단위의 채널 상관도를 측정하고, 상기 프레임 단위의 채널 상관도에 따라 상기 분할된 신호를 재분할하는 파라메터 분석 수단을 포함하며, 상기 파라메터 분석 수단은, 상기 프레임 단위 채널 상관도가 제1 소정의 값 이하인 경우 복호화를 위한 큐 파라메터로서, 상기 재분할된 신호의 서브밴드에 대한 채널 ID와 서브밴드 단위 채널 상관도를 추출하여 부호화하는 것을 특징으로 한다.
본 발명은 다채널 오디오 신호의 복호화에 필요한 큐 파라메터를 최적화함으로써 적은 대역폭이 할당되는 환경에서도 단일채널 오디오 신호로부터 다채널 오디오 신호를 복원하여 재생할 수 있는 효과를 제공한다.
오디오 코딩, 큐 파라메터, 다채널, 채널 상관성-
公开(公告)号:KR100275529B1
公开(公告)日:2000-12-15
申请号:KR1019970025241
申请日:1997-06-17
Applicant: 한국전자통신연구원
IPC: G06F3/16
Abstract: PURPOSE: A text-to-voice converter using a trick mode and a method thereof are provided to generates a composite sound by enabling a user to designate an arbitrary sentence using a trick mode and a slide bar and to determine interface between information and a text-to-voice converter. CONSTITUTION: A graphic user interface module(230) sets a file using a file button, and transmits information on the file to an input text analysis module(210). The input text analysis module(210) receives and analyzes the information on the file, and transmits the result. A user input analysis module(220) receives the information on sentence analysis from the input text analysis module(210). The user input analysis module(220) analyzes a user input command inputted from the graphic user interface module(230). In addition, the user input analysis module(220) transmits the user input information analyzed. A synthesizer module(240) converts a text into the voice using the user input information analyzed. The synthesizer module(240) reports information on the sentence outputted as a composite sound to a user through the graphic user interface module(230).
Abstract translation: 目的:提供一种使用特技模式的文本到语音转换器及其方法,用于通过使用户能够使用特技模式和滑杆来指定任意句子并且确定信息与文本之间的接口来产生复合声音 到语音转换器。 构成:图形用户界面模块(230)使用文件按钮设置文件,并将文件信息发送到输入文本分析模块(210)。 输入文本分析模块(210)接收并分析文件信息,并发送结果。 用户输入分析模块(220)从输入文本分析模块(210)接收关于句子分析的信息。 用户输入分析模块(220)分析从图形用户界面模块(230)输入的用户输入命令。 此外,用户输入分析模块(220)发送分析的用户输入信息。 合成器模块(240)使用分析的用户输入信息将文本转换成语音。 合成器模块(240)通过图形用户界面模块(230)向用户报告关于作为复合声音输出的句子的信息。
-
公开(公告)号:KR100194811B1
公开(公告)日:1999-06-15
申请号:KR1019960069813
申请日:1996-12-21
Applicant: 한국전자통신연구원
IPC: H04R3/00
Abstract: [청구범위에 기재된 발명이 속한 기술분야]
3차원 음향처리에 필요한 머리전달함수를 측정하는 장치.
[발명이 해결하려고 하는 기술적 과제]
표준 머리, 귀 및 몸통 등의 표준 치수에 따라 마네킹을 설계, 제작하여 고막 위에 3차원 음향처리에 필요한 머리 전달 함수 측정을 위한 정밀 측정용 마이크로폰을 장착하여 표준 머리 전달함수를 측정하고자 함.
[발명의 해결방법의 요지]
임펄스 신호를 발생하여 이 신호의 고도각의 변환이 가능하게 한 스피커 이동 레일에 연결된 스피커를 통해 출력하고, 머리, 귀, 몸통 구조를 갖는 형상으로 이루어지고, 턴 테이블에 고정되어 방위각의 변환이 가능하며, 귀에 마이크로폰을 구비한 머리 및 몸통 세트를 통해 스피커로부터 출력된 소리를 전기신호로 변환하고, 마이크로폰을 통해 수신된 신호를 증폭한 후, 이 신호를 분석하여 각 방위각과 고도각에 대한 머리 전달함수를 기록하도록 구성됨.
[발명의 중요한 용도]
머리전달함수 측정 장치에 이용됨.-
公开(公告)号:KR100175464B1
公开(公告)日:1999-04-01
申请号:KR1019950055859
申请日:1995-12-23
Abstract: 본 발명은 전화번호 안내시스템(114 안내시스템)에서 114 안내음성의 자연성을 향상시킬 수 있을 뿐만아니라 중복 음성단위를 별도로 저정하여 메모리 사용량을 줄일 수 있도록 한 전화번호 안내용 음성데이터 제작 방법에 관한 것으로, 전화번호 안내음성에서 중북되는 음성단위를 추출하여 유사음운 환경별로 그룹화하는 제1단계;상기 유사음운 환경별로 숫자음 음절위치에 따른 영향을 고려하여 숫자음 음성단위를 생성하는 제2단계;숫자음 음운환경에 따라 음운환경이 경음화된 음성단위를 생성하는 제3단계;및 전화번호 안내문장을 이루는 나머지 전체 음성단위를 생성하는 제4단계를 구비하여, 음운환경, 숫자음의 위치, 경음화 등을 고려하므로써 안내음성의 자연성을 향상시킬 수 있고, 요구되는 메모리의 크기도 최소화할 수 있는 효과가 있다.
-
公开(公告)号:KR100173924B1
公开(公告)日:1999-04-01
申请号:KR1019960006074
申请日:1996-03-08
Applicant: 한국전자통신연구원
IPC: G10L25/90
Abstract: 본 발명은 음성신호의 유성음에 성대 폐쇄 시점 정보인 이포크(epoch)를 검출하는 방법에 관한 것으로서, 음성합성, 인식, 부호화 분야에서 발성자에 따른 영향을 최소화하면서 음성신호를 정확히 분석하는데 반드시 필요한 정보인 유성음의 이포크(epoch)를 음성신호에서 직접 정확하게 추출할 수 있을 뿐만 아니라 고속처리가 가능한 이포크(epoch) 검출 방법을 제공하기 위하여 프레임 단위별 평균 피치를 참조하여 저역 통과된 유성음 신호에서 영교차점별 평균 진폭 변동율에 의해 의사 이포크(pseudo-epoch)를 검출하고, 대역 통과된 유성음 신호(성대 파형에 의한 저역 성분이 제거된 신호)를 이용하여 의사 이포크 부근에 존재하는 보다 정밀한 실제 이포크를 최종적으로 결정하는 과정을 통해 이포크(epoch)가 존재할 수 있는 영역을 좁혀 나아가면서 처리하 므로 검출오차를 줄일 수 있고, 평균 피치 검출 에러 발생시에는 현재의 이포크(epoch)에 의해 다음 프레임의 평균 피치를 근사적으로 결정할 수 있으므로 결정 에러를 줄일 수 있으며, 사인파 형태의 음성신호에서도 정밀한 이포크(epoch) 결정이 가능하며 시간영역에서 처리되어 계산량이 적으므로 고속 처리가 가능한 효과가 있다.
-
公开(公告)号:KR1019990001793A
公开(公告)日:1999-01-15
申请号:KR1019970025241
申请日:1997-06-17
Applicant: 한국전자통신연구원
IPC: G06F3/16
Abstract: 1. 청구 범위에 기재된 발명이 속한 기술분야
본 발명은 트릭 모드(Trick Mode)를 이용한 텍스트/음성 변환기 및 그 방법에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은 트릭 모드, 파일 슬라이더 바, 및 문장 슬라이더 바를 이용해 텍스트의 임의의 위치를 지정하여 문장 전체를 합성하는 것과 동일한 운율 패턴을 유지하면서 지정한 임의의 위치에서부터 텍스트를 음성으로 합성하는 텍스트/음성변환기 및 그 방법을 제공하고자 함.
3. 발명의 해결방법의 요지
본 발명의 장치는, 입력 텍스트 분석 모듈; 그래픽 사용자 인터페이스 모듈; 사용자 입력 분석 모듈; 및 상기 사용자 입력 분석 모듈에서 전송된 정보의 텍스트를 음성으로 합성하여 출력하는 합성 모듈을 포함하고, 한편 본 발명의 방법은, 합성기를 동작시키기 위해 선택한 파일을 여는 제 1 단계; 선택한 파일의 문장을 트릭 모드를 이용해 합성 시작점을 선택하는 제 2 단계; 및 해당하는 문장을 합성하여 음성으로 변환하는 제 3 단계를 포함한다.
4. 발명의 중요한 용도
본 발명은 텍스트/음성변환기에 이용됨.-
公开(公告)号:KR1019980050965A
公开(公告)日:1998-09-15
申请号:KR1019960069813
申请日:1996-12-21
Applicant: 한국전자통신연구원
IPC: H04R3/00
Abstract: 1. 청구범위에 기재된 발명이 속한 기술분야
3차원 음향처리에 필요한 머리전달함수를 측정하는 장치.
2. 발명이 해결하려고 하는 기술적 과제
표준 머리, 귀, 및 몸통 등의 표준 치수에 따라 마네킹을 설계, 제작하여 고막 위치에 3차원 음향처리에 필요한 머리 전달함수 측정을 위한 정밀 측정용 마이크로폰을 장착하여 표준 머리 전달함수를 측정하고자 함.
3. 발명의 해결방법의 요지
임펄스 신호를 발생하여 이 신호를 고도각의 변환이 가능하게 한 스피커 이동 레일에 연결된 스피커를 통해 출력하고, 머리, 귀, 몸통 구조를 갖는 형상으로 이루어지고, 턴 테이블에 고정되어 방위각의 변환이 가능하며, 귀에 마이크로폰을 구비한 머리 및 몸통 세트를 통해 스피커로부터 출력된 소리를 전기신호로 변환하고, 마이크로폰을 통해 수신된 신호를 증폭한 후, 이 신호를 분석하여 각 방위각과 고도각에 대한 머리 전달함수를 기록하도록 구성됨.
4. 발명의 중요한 용도
머리전달함수 측정장치에 이용됨.-
公开(公告)号:KR1019980036107A
公开(公告)日:1998-08-05
申请号:KR1019960054590
申请日:1996-11-15
Applicant: 한국전자통신연구원
IPC: G10L13/10
Abstract: 1. 청구 범위에 기재된 발명이 속한 기술분야
본 발명은 텍스트/음성변환기 및 그 방법에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
텍스트 이외에 자연 음성으로부터 추정된 개인성 정보와 운율 정보 등의 다단계 정보를 이용하여 합성음의 개인성을 확보하고 자연성을 향상시키는 텍스트/음성변환기 및 그 방법을 제공하고자 함.
3. 발명의 해결방법의 요지
개인성 정보와 운율 정보를 텍스트 정보와 함께 구성한 다단계 정보를 처리하는 인터페이스; 개인성 정보에 따라 적합한 합성 단위들을 선정하는 표준화 합성 단위 데이타베이스; 텍스트를 음소열로 변환하고, 운율 정보를 추정하여 심볼화하는 언어 처리부; 개인성 정보와 규칙 및 테이블을 이용하여 운율 파라미터값을 계산하는 운율 처리부; 및 운율 파라미터값과 합성 단위를 이용하여 합성음을 생성하는 신호 처리부를 포함한다.
4. 발명의 중요한 용도
텍스트를 음성으로 변환하는데 이용됨.
-
-
-
-
-
-
-
-
-