-
公开(公告)号:KR100194814B1
公开(公告)日:1999-06-15
申请号:KR1019960054590
申请日:1996-11-15
Applicant: 한국전자통신연구원
IPC: G10L13/10
Abstract: 1. 청구 범위에 기재된 발명이 속한 기술분야
본 발명은 텍스트/음성변환기 및 그 방법에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
텍스트 이외에 자연 음성으로부터 추정된 개인성 정보와 운율 정보 등의 다단계 정보를 이용하여 합성음의 개인성을 확보하고 자연성을 향상시키는 텍스트/음성변환기 및 그 방법을 제공하고자 함.
3. 발명의 해결방법의 요지
개인성 정보와 운율 정보를 텍스트 정보와 함께 구성한 다단계 정보를 처리하는 인터페이스; 개인성 정보에 따라 적합한 합성 단위들을 선정하는 표준화 합성 단위 데이타베이스; 텍스트를 음소열로 변환하고, 운율 정보를 추정하여 심볼화하는 언어 처리부; 개인성 정보와 규칙 및 테이블을 이용하여 운율 파라미터값을 계산하는 운율 처리부; 및 운율 파라미터값과 합성 단위를 이용하여 합성음을 생성하는 신호 처리부를 포함한다.
4. 발명의 중요한 용도
텍스트를 음성으로 변환하는데 이용됨.-
公开(公告)号:KR1019980050173A
公开(公告)日:1998-09-15
申请号:KR1019960068952
申请日:1996-12-20
Applicant: 한국전자통신연구원
IPC: G10L25/90
Abstract: 본 발명은 유성음 구간에서 피치동기식 포먼트 검출방법에 관한 것이다. 그 목적은 LP(Linear Prediction) 기법으로 음성신호의 유성음 구간에서 피치 길이에 관계없이 음원에 의한 영향을 최소화하면서 정밀한 포먼트 정보를 추출하는 데에 있다. 그 특징은 에포크를 참조하여 분석구간의 길이를 결정하는 단계와, 선택된 분석구간 내에서 각각의 성대개방 구간 중 에포크로부터 해당 피치의 20% 내외의 구간을 '0'으로 대치하고 공분산 선형예측 분석을 수행하는 단계와, 결정단계에서 산출된 선형예측 계수를 이용하여 '0'으로 삽입된 각각의 성대개방 구간을 선형 예측된 값으로 대치하여 성대의 영향을 줄이면서 신호의 연속성을 유지시키고 다시 공분산 선형예측계수를 산출하는 단계와, 공분산 선형예측 분석단계에서 산출된 선형예측계수를 이용하여 성대개방 구간을 피치의 30% 내외까지 확장하여 성대펄스의 영향을 제거하고 최종적인 선형예측 분석을 수행하여 포먼트 정보를 추출하는 단계 및 전체 음성신호에 대해 단계들을 모두 수행하여 얻은 포먼트궤적에 대하여 피치 주기별로 포먼트 의 변화치를 산출하여 그 값이 200Hz를 초과할 경우에 에러발생 여부를 확인하고 궤적의 밀림현상을 보정하여 최종적인 포먼트 궤적을 구하는 단계로 이루어지는 데에 있다.
-
公开(公告)号:KR1019970067093A
公开(公告)日:1997-10-13
申请号:KR1019960006074
申请日:1996-03-08
Applicant: 한국전자통신연구원
IPC: G10L25/90
Abstract: 본 발명은 음성신호의 유성음에서 성대 폐쇄 시점 정보인 이포크(epoch)를 검출하는 방법에 관한 것으로서, 음성합성, 인식, 부호와 분야에서 발성자에 따른 영향을 최소화하면서 음성신호를 정확히 분석하는데 반드시 필요한 정보인 유성음의 이포크(epoch)를 음성신호에서 직접 정확하게 추출할 수 있을 뿐만 아니라 고속처리가 가능한 이포크(epoch) 검출 방법을 제공하기 위하여 프레임 단위별 평균 피치를 참조하여 저역 통과된 유성음 신호에서 영교차점별 평균 진폭 변동률에 의해 의사 이포크(pseudo-epoch)를 검출하고, 대역 통과된 유성음 신호(성대 파형에 의한 저역 성분이 제거된 신호)를 이용하여 의사 이포크 부근에 존재하는 보다 정밀한 실제 이포크를 최종적으로 결정하는 과정을 통해 이포크(epoch)가 존재할 수 있는 영역을 좁혀 나아가면서 처리 하므로 검출오차를 줄일 수 있고, 평균 피치 검출 에러 발생시에는 현재의 이포크(epoch)에 의해 다음 프레임의 평균 피치를 근사적으로 결정할 수 있으므로 결정 에러를 줄일 수 있으며, 사인파 형태의 음성신호에서도 정밀한 이포크(epoch) 결정이 가능하며 시간영역에서 처리되어 계산량이 적으므로 고속 처리가 가능한 효과가 있다.
-
公开(公告)号:KR1019970050115A
公开(公告)日:1997-07-29
申请号:KR1019950055840
申请日:1995-12-23
Applicant: 한국전자통신연구원
IPC: G10L15/04
Abstract: 본 발명은 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법에 관한 것으로, 삼음소열 또는 이에 해당하는 코드열을 입력받아 중음소가 자음, 모음, 묵음중 어느 것인가 판단하는 제1단계; 상기 중음소가 자음이면 좌음소와 우음소 모음군 부류화 또는 좌음소 모음군 부류화를 수행하는 제2단계; 상기 중음소가 모음이면 좌음소가 우음소에 따라 우음소 초성, 종성 좌음군 부류화, 우음소 SIL(silence)노드화, 좌음소 초성 자음군 부류화를 수행하는 제3단계; 및 상기 중음소가 묵음이면 SIL 노드화하는 제4단계를 포함하는 것을 특징으로 하여 음소단위나 트라이폰 단위를 기반으로 하는 음성인식, 음성합성에 보다 유용한 모델링 및 분석 단위로 사용할 수 있는 효과가 있다.
-
公开(公告)号:KR1019970050108A
公开(公告)日:1997-07-29
申请号:KR1019950055841
申请日:1995-12-23
Applicant: 한국전자통신연구원
IPC: G10L13/00
Abstract: 본 발명은 텍스트/음성 변환기(text-to-speech conversion system)에서 억양패턴 정규화와 신경망 학습을 이용한 억양 생성 방법에 관한 것으로서, 음성 합성 장치에 적용되는 텍스트/음성변환기에서 억양패턴 정규화와 신경막 학습을 이용한 억양 생성 방법에 있어서, 합성 데이타베이스(3)로부터 음성 데이타를 읽어 음절의 피치 패턴을 정규화 및 표준화하고 어절내 각 음절의 평균 피치값에서 어절의 평균 피치값을 뺀 피치값으로 어절피치패턴을 학습하고, 문장내 각 어절의 평균 피치값으로부터 분장의 기준억양을 추정한 수, 문장의 문맥에 따른 문법 속성열과 그에 해당되는 억양패턴테이블을 작성하는 제1단계(10 내지 15); 한국어 문장과 문법 속성열이 입력되면 문자의 기준억야 생성 과정에서 각 어절에 대해 문장내 위치에 따라 1차 평균 피치값을 할당하고, 비균일 단위의 억양패턴 생성 과정에서 입력된 문법 속성열을 이용하여 왼쪽우선 검색 방법으로 최장 일치 부분을 억양패턴테이블에서 찾아 해당 어절에 2차 평균피치값을 할당하고, 어절의 피치 패턴 생성 과정에서 신경막을 이용하여 각 음절의 평균 피치값 변화량을 계산하고, 음절의 피치 패턴 생성 과정에서는 각 음절을 구성하는 음소열과 표준 피치 패턴 테이블을 이용하여 음질의 피치 패턴을 계산하고, 각 과정의 결과를 합하여 전체 문장의 억양을 생성하여 출력하는 제2단계(16 내지 21)를 포함하여 실제 음성데이타를 분석하여 억양 제어 규칙을 작성하고 합성음의 억양 제어를 통해 합성음의 자영선과 유 서을 향상시킴으로써 통신 서비스, 사무 자동화, 교육 등의 여러 분야에 응용할 수 있는 효과가 있다.
-
公开(公告)号:KR101840041B1
公开(公告)日:2018-03-19
申请号:KR1020170056375
申请日:2017-05-02
Applicant: 한국전자통신연구원
IPC: G10L19/008 , G10L19/018 , G10L19/035
CPC classification number: G10L19/20 , G10L19/008
Abstract: 포스트다운믹스신호를지원하는다객체오디오부호화장치및 복호화장치가개시된다. 다객체오디오부호화장치는입력객체신호로부터다운믹스신호와객체정보를추출하는추출부, 상기추출된다운믹스신호와상기포스트다운믹스신호를이용하여다운믹스정보파라미터를결정하는파라미터결정부및 상기다운믹스정보파라미터와상기객체정보를조합하여객체비트스트림을생성하는비트스트림생성부를포함할수 있다.
Abstract translation: 公开了支持降后信号的多对象音频编码设备和解码设备。 来自输入对象信号的多客体音频编码设备缩混信号和所述提取单元提取的对象信息,所提取的降混信号,并通过使用一个混合信号降混信息参数确定单元,确定一个参数部分和向下下降后 以及比特流生成器,用于通过组合混合信息参数和对象信息来生成对象比特流。
-
公开(公告)号:KR1020160043947A
公开(公告)日:2016-04-22
申请号:KR1020160044611
申请日:2016-04-12
Applicant: 한국전자통신연구원
IPC: G10L19/008 , G10L19/00 , G10L19/018 , G10L19/035
CPC classification number: G10L19/20 , G10L19/008
Abstract: 포스트다운믹스신호를지원하는다객체오디오부호화장치및 복호화장치가개시된다. 다객체오디오부호화장치는입력객체신호로부터다운믹스신호와객체정보를추출하는추출부, 상기추출된다운믹스신호와상기포스트다운믹스신호를이용하여다운믹스정보파라미터를결정하는파라미터결정부및 상기다운믹스정보파라미터와상기객체정보를조합하여객체비트스트림을생성하는비트스트림생성부를포함할수 있다.
Abstract translation: 公开了一种多对象音频编码装置和支持后降混信号的解码装置。 多对象音频编码装置包括:提取单元,从输入对象信号中提取下混合信号和对象信息; 参数确定单元,其通过使用所提取的下混合信号和后降混信号来确定下混信息参数; 以及比特流生成单元,其通过混合下混信息参数和对象信息来生成对象比特流。
-
公开(公告)号:KR1020120040579A
公开(公告)日:2012-04-27
申请号:KR1020100102077
申请日:2010-10-19
Applicant: 한국전자통신연구원
IPC: H04N7/173
CPC classification number: H04N21/2405 , H04N21/6334
Abstract: PURPOSE: A device for providing an adaptive broadcasting service and a method thereof are provided to monitor the state of a plurality of servers and control a corresponding server. CONSTITUTION: A user managing unit(103) confirms user authentication. A monitoring unit(105) monitors a state of a server(120). When the user authentication is confirmed, a control unit(107) extracts server information corresponding to a requested service referring to a database(109). The control unit transmits a service of the server related to the server information to a terminal(110).
Abstract translation: 目的:提供一种用于提供自适应广播服务的设备及其方法,以监视多个服务器的状态并控制相应的服务器。 构成:用户管理单元(103)确认用户认证。 监视单元(105)监视服务器(120)的状态。 当确认用户认证时,控制单元(107)提取与数据库(109)相对应的所请求服务的服务器信息。 控制单元将与服务器信息相关的服务器的服务发送到终端(110)。
-
公开(公告)号:KR1020100008755A
公开(公告)日:2010-01-26
申请号:KR1020090061736
申请日:2009-07-07
Applicant: 한국전자통신연구원
IPC: G10L19/20 , G10L19/008 , G11B20/10 , H04N21/233
CPC classification number: G10L19/20 , G10L19/008
Abstract: PURPOSE: A multi-object audio encoding device for supporting a post downmix signal and a decoding device thereof are provided to create downmix information parameters distributed based on 0dB and perform quantization/inverse quantization. CONSTITUTION: An object information extraction and downmix generation unit(201) creates a downmix signal and object information from an input object. A parameter determining unit(202) includes a power offset calculating part which scales the post downmix signal into the preset value, and a parameter extracting part which extracts a downmix information parameter from the scaled post downmix signal in the specific frame. A bitstream generating unit(203) creates an object bit stream by combining the downmix information parameter and the object information.
Abstract translation: 目的:提供一种用于支持后降混信号的多对象音频编码装置及其解码装置,用于创建基于0dB分布的下混信息参数并进行量化/反量化。 构成:对象信息提取和下混生成单元(201)从输入对象创建下混合信号和对象信息。 参数确定单元(202)包括功率偏移计算部分,其将后下混合信号缩放为预设值,以及参数提取部分,其从特定帧中的缩放的后降混信号中提取降混信息参数。 比特流生成单元(203)通过组合缩混信息参数和对象信息来创建对象比特流。
-
公开(公告)号:KR100922580B1
公开(公告)日:2009-10-21
申请号:KR1020070043248
申请日:2007-05-03
IPC: G10L21/0208 , H04L12/66
Abstract: 본 발명은 VoIP 서비스를 위한 잡음 제거 장치 및 방법에 관한 것으로, 입력 신호의 SNR 가중치를 반영하여 잡음을 제거하기 위하여, 잡음 음성 신호에 대한 음성 파워 스펙트럼과 잡음 파워 스펙트럼을 예측하는 파워 스펙트럼 예측기와, 상기 음성 파워 스펙트럼과 잡음 파워 스펙트럼으로부터 SNR를 계산하고, 상기 계산된 SNR에 대응되는 SNR 가중치를 획득한 후, 상기 SNR 가중치를 반영하는 위너 필터 함수를 설계하는 위너 필터 설계부와, 상기 위너 필터 함수를 이용하여 상기 잡음 음성 신호에 포함된 잡음 신호를 제거하는 위너 필터부를 포함하여 구성되며, 이에 의하여 VoIP 서비스에서 보다 향상된 통화 음질을 제공할 수 있도록 한다.
VoIP 서비스, 잡음 제거, SNR 가중치
-
-
-
-
-
-
-
-
-