-
公开(公告)号:KR1019980037190A
公开(公告)日:1998-08-05
申请号:KR1019960055906
申请日:1996-11-21
Applicant: 한국전자통신연구원
IPC: G10L25/90
Abstract: 본 발명은 음성 신호 처리 방법에 관한 것으로, 약 500㎐로 저역 통과된 유성음 신호에서 인접한 영교차점 구간별 면적을 산출하고 인접한 면적의 합을 구하여 피치를 검출하기 용이한 진폭 변화를 피크를 산출한다. 그리고 분석 프레임 내에서 대표적인 진폭 변화 피크의 수에 따라 분석 프레임의 길이를 재설정한 후 임의의 두 진폭 변화 피크의 크기에 대한 유사도를 두 피크의 거리에 대한 분포로 나타내고 최대 분포 봉우리의 중심 거리를 측정하여 분석 구간 내에서의 피치 및 후보 피치를 검출한다. 또한 전체 음성 신호의 피치 윤곽선에서 프레임별 피치 변화치를 참조로 예상 검출에러 구간에 대해 후보 피치를 이용하여 에러를 수행한다. 이렇게 함으로서 보다 정확한 피치를 검출할 수 있고 광범위한 피치의 분포와 변화에 적응이 용이할 뿐 아니라 고속 처리가 가능한 유성음 구간에서 프레임별 피치 검출 방법이 제시된다.
-
公开(公告)号:KR100128844B1
公开(公告)日:1998-04-15
申请号:KR1019940034757
申请日:1994-12-16
IPC: G06F17/30
Abstract: Disclosed is an apparatus and method to search an information-communication service using a voice synthesis. The apparatus comprises a member processor(1), a voice synthesizer(3), a service connector(4) and a central processor(2). The member processor(1) matches the members having a general electronic telephone. The voice synthesizer(3) synthesizes voices and sends the result signal to the member processor(1). The service connector(4) connects to the information-communication service network. The central processor(2) controls each component. Thereby, the members having a general electronic telephone are able to access the information-communication service.
Abstract translation: 公开了一种使用语音合成来搜索信息通信服务的装置和方法。 该装置包括成员处理器(1),语音合成器(3),服务连接器(4)和中央处理器(2)。 会员处理器(1)与具有通用电子电话的成员相匹配。 语音合成器(3)合成语音,并将结果信号发送给会员处理器(1)。 服务连接器(4)连接到信息通信服务网络。 中央处理器(2)控制每个组件。 因此,具有一般电子电话的成员能够访问信息通信服务。
-
公开(公告)号:KR1019970056663A
公开(公告)日:1997-07-31
申请号:KR1019950055859
申请日:1995-12-23
Abstract: 본 발명은 114 안내음성의 자연성 개선 방법에 관한 것으로서, 114 안내 시스템에 있어서, 중복되는 음성 단위를 추출하는 제1단계; 상기 제1단계후 유사음운 환경을 이용하여 그룹화 하는 제2단계; 상기 제2단계후 음운환경이 경음화된 음성 단위를 생성하는 제3단계; 및 상기 제3단계후 114 안내 문장을 이루는 기타 음성 단위를 생성되는 제4단계를 구비하여 종래 114 안내음성의 대표적 부자연스런 부분(네 : [숫자음]+[국에],[숫자음]+[번입니다])을 개선하고 중복되는 음성단위(예 : 천, 백, 십, 국에, 번)를 따로 저장하여 메모리 사용량을 줄일 수 있는 효과가 있다.
-
公开(公告)号:KR1019960024888A
公开(公告)日:1996-07-20
申请号:KR1019940036104
申请日:1994-12-22
IPC: G06F3/16
Abstract: 본 발명은 한국어 문자를 음성으로 합성하는 방법에 대한 것으로서, 음성을 다이폰 단위로 세분하여 합성 데이타베이스로부터 파라미터를 가져와서 LSP합성방식으로 음성으로 변환하는 방법이다. 본 발명에 사용한 특징으로는 다이폰 단위로의분류와 결합을 효율적으로 세분화하였으며 합성 데이타베이스를 구성하는 경우 각각의 다이폰에 대해서 특수한 경계표시를 하였다. 각각의 경계표시는 다이폰의 유형에 따라서 서로 다른 의미를 가지며 합성단위들을 결합하는 경우 길이의 조절과 결합이 용이하도록 구성하였다. 또한 음성합성기술의 관건은 합성음의 품질이므로 LSP 합성필터의 음원으로 수정된LF 모델과 리지쥬얼(residual)신호를 사용하여 자연성과 명료성을 높이고자 하였다.
본 발명은 현재 늘어가는 정보 통신 서비스와 연결될 경우 합성기술을 이용한 정보검색의 급증으로 새로운 정보제공 기술의 증진을 가져오는 효과를 가진다.-
公开(公告)号:KR101734452B1
公开(公告)日:2017-05-12
申请号:KR1020160044611
申请日:2016-04-12
Applicant: 한국전자통신연구원
IPC: G10L19/008 , G10L19/00 , G10L19/018 , G10L19/035
CPC classification number: G10L19/20 , G10L19/008
Abstract: 포스트다운믹스신호를지원하는다객체오디오부호화장치및 복호화장치가개시된다. 다객체오디오부호화장치는입력객체신호로부터다운믹스신호와객체정보를추출하는추출부, 상기추출된다운믹스신호와상기포스트다운믹스신호를이용하여다운믹스정보파라미터를결정하는파라미터결정부및 상기다운믹스정보파라미터와상기객체정보를조합하여객체비트스트림을생성하는비트스트림생성부를포함할수 있다.
-
公开(公告)号:KR101614160B1
公开(公告)日:2016-04-20
申请号:KR1020090061736
申请日:2009-07-07
Applicant: 한국전자통신연구원
IPC: G10L19/20 , G10L19/008 , G11B20/10 , H04N21/233
CPC classification number: G10L19/20 , G10L19/008
Abstract: 포스트다운믹스신호를지원하는다객체오디오부호화장치및 복호화장치가개시된다. 다객체오디오부호화장치는입력객체신호로부터다운믹스신호와객체정보를추출하는추출부, 상기추출된다운믹스신호와상기포스트다운믹스신호를이용하여다운믹스정보파라미터를결정하는파라미터결정부및 상기다운믹스정보파라미터와상기객체정보를조합하여객체비트스트림을생성하는비트스트림생성부를포함할수 있다.
Abstract translation: 可以提供支持后降混信号的多对象音频编码和解码装置。 多对象音频编码装置可以包括:对象信息提取和下混合生成单元,用于从输入对象信号生成对象信息和后同步信号; 参数确定单元,用于使用所提取的下混合信号和后下混合信号来确定下混信息参数; 以及比特流生成单元,用于组合对象信息和下混信息参数,并生成对象比特流。
-
37.
公开(公告)号:KR101387808B1
公开(公告)日:2014-04-21
申请号:KR1020090116017
申请日:2009-11-27
Applicant: 한국전자통신연구원
Abstract: 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 방법 및 장치가 개시된다. 고품질 다객체 오디오 부호화/복호화 장치는, 객체 신호와 가수의 보컬 같은 특정 객체를 나누어 처리하여 객체 기반 오디오 부호화/복호화 장치의 효율성을 높일 수 있다. 또한, 특정 객체 신호의 제어를 위해 사용되는 잔차 신호 부호화의 효율성을 높이기 위하여 가변 비트율을 이용한 잔차 신호 부호화를 제안함으로써 고정 비트율을 사용하는 경우와 같은 성능을 얻을 수 있다.
객체 기반 오디오 부호화, 복호화 장치, 잔차 신호(Residual Signal) 부호화-
38.
公开(公告)号:KR1020100007740A
公开(公告)日:2010-01-22
申请号:KR1020090061636
申请日:2009-07-07
Applicant: 한국전자통신연구원
CPC classification number: G11B27/034 , G10L19/008
Abstract: PURPOSE: A method and a device for editing an audio object in a multi-object audio code based on space information are provided to omit a coding process about the edited object using the multi-object bit stream and a down mix signal generated through the coding of the input objects. CONSTITUTION: An object information extractor(210) receives an object bit stream. The object information extractor extracts the object information from the object bit stream. A down mix processor(220) receives the down mix signal. The down mix processor controls the down mix signal using the object edition information and the object information. A bit stream processor(230) edits the object information according to the object edition information. The bit stream processor generates the object bit stream controlled based on the edited object information.
Abstract translation: 目的:提供一种用于基于空间信息编辑多对象音频代码中的音频对象的方法和装置,以使用多对象比特流和通过编码产生的下混合信号来省略关于编辑对象的编码处理 的输入对象。 构成:对象信息提取器(210)接收对象比特流。 对象信息提取器从对象比特流中提取对象信息。 下混合处理器(220)接收下混合信号。 下混合处理器使用对象版本信息和对象信息来控制下混合信号。 比特流处理器(230)根据对象版本信息编辑对象信息。 比特流处理器基于编辑的对象信息生成受控的对象比特流。
-
公开(公告)号:KR100740807B1
公开(公告)日:2007-07-19
申请号:KR1020040117805
申请日:2004-12-31
Applicant: 한국전자통신연구원
IPC: G10L19/008 , G10L19/02
Abstract: 본 발명은 공간정보기반 오디오 부호화(SAC: Spatial Audio Coding) 방식을 이용한 멀티채널 오디오 신호의 부호화 및 복호화하는 과정에서 부가정보로 사용되는 공간정보 (spatial cue)를 추출 및 적용하는 방법에 관한 것이다. 본 발명의 일특징에 따르면, 멀티채널 오디오 신호의 공간정보 오디오 부호화시에 각 서브밴드별 공간 정보를 추출하는 방법이 제공된다. 상기 공간정보 추출 방법은, 좌우 비대칭적이고 동일한 최대치를 지니며 이웃한 창함수와 중첩되는 부분에서 그 합이 일정 상수로 표현되도록 서브밴드별 창함수를 선정하는 단계와, 상기 선정된 창함수를 이용하여 공간정보를 추출하는 단계를 포함하는 것을 특징으로 한다. 일실시예에서, 상기 공간 정보는 채널간 에너지비(Inter-Channel Level Difference: ICLD)이다.
공간정보 기반 오디오 부호화(spatial audio coding:SAC), ICLD(Inter Channel Level Difference)-
公开(公告)号:KR1020060079119A
公开(公告)日:2006-07-05
申请号:KR1020050134637
申请日:2005-12-30
Applicant: 한국전자통신연구원
IPC: G10L19/008 , G10L19/02
Abstract: 본 발명은 멀티채널 오디오 신호 또는 복수개의 독립된 오디오 신호를 모노 또는 스테레오로 다운믹스된 신호와 공간 정보(spatial cues)로 표현 및 전송시에 공간정보의 추정 및 양자화를 수행하는 방법에 관한 것이다. ICLD를 추정하는데 있어서 각 서브밴드에 대하여 최대 평균에너지를 갖는 채널을 기준채널로 이용하여 ICLD를 추정하는 방법과, 각 부가정보를 전송하기 이전에 양자화를 수행하는 방법에 있어서 비대칭 비선형 양자화(asymmetric nonuniform quantization)를 수행하는 방법을 제안한다.
공간정보기반 오디오 코딩(Spatial Audio Coding:SAC), 바이노럴 큐 코딩(Binaural Cue Coding: BCC), 채널간 에너지 비(Inter Channel Level Difference:ICLD), 채널간 시간 지연 비(Inter Channel Time Difference:ICTD), 양자화(quantization)
-
-
-
-
-
-
-
-
-