영역의존 음성합성용 데이터베이스를 이용한 음성 합성 방법
    1.
    发明公开
    영역의존 음성합성용 데이터베이스를 이용한 음성 합성 방법 失效
    使用相关语音合成数据库的语音合成方法

    公开(公告)号:KR1020000034136A

    公开(公告)日:2000-06-15

    申请号:KR1019980051342

    申请日:1998-11-27

    Abstract: PURPOSE: A voice synthesizing method using section dependent voice synthesizing database is provided to select a section dependent optimum text from the text copies by section and then set a voice synthesizing data base, thereby a synthesizing voice of satisfactory quality. CONSTITUTION: A voice synthesizing method using section dependent voice synthesizing database comprises steps of: extracting inherent try-phone occurrence frequency from text copies by section, thereby selecting an optimum text set; extracting an EGG signal from the occurred section dependent text, and then dividing it into try-phone unit to set a synthesizing data base; and synthesizing voice by using the set section dependent database and a unlimited synthesizing database.

    Abstract translation: 目的:提供一种使用部分相关语音合成数据库的语音合成方法,从文本逐段选择一段相关最佳文本,然后设置语音合成数据库,从而形成令人满意质量的综合语音。 构成:使用部分依赖语音合成数据库的语音合成方法包括以下步骤:从文本拷贝逐段提取固有的试听手机出现频率,从而选择最佳文本集; 从发生的部分相关文本中提取EGG信号,然后将其分为试用手机单元以设置合成数据库; 以及通过使用设置部分依赖数据库和无限合成数据库来合成语音。

    텍스트/음성 변환기에서 신경망을 이용한 에너지컨투어 생성 방법
    2.
    发明公开
    텍스트/음성 변환기에서 신경망을 이용한 에너지컨투어 생성 방법 无效
    如何在文本到语音转换器中使用神经网络生成能量轮廓

    公开(公告)号:KR1019990047332A

    公开(公告)日:1999-07-05

    申请号:KR1019970065689

    申请日:1997-12-03

    Abstract: 본 발명은 텍스트/음성 변환기(text-to-speech conversion system)에서 신경망을 이용한 에너지 컨투어 생성 방법에 관한 것이다.
    종래 합성기는 입력된 텍스트로부터 합성음을 생성하는데 있어서 에너지 컨투어 제어를 인접한 합성단위간의 에너지 컨투어 평활화와 강세 정도의 처리 만을 하고 있다. 그러므로 종래의 텍스트/음성변환기 방식을 이용하여 문장단위의 에너지 컨투어를 제어하기는 불가능하다.
    따라서, 본 발명은 음운환경, 단어간 끊어읽기, 앞/현재/뒤 단어의 평균 피치값을 입력으로 하는 다층신경망을 이용한 학습방법을 사용하여 문장내 음절의 에너지값을 추정, 합성음 생성에 사용함으로써 합성음의 자연성 구현을 그 목적으로 한다. 본 발명은 입력 텍스트에 대한 언어처리 결과를 입력받아서 문장내 음절의 에너지값을 출력하는 다층신경망을 이용하여 실제 음성데이타의 음절 에너지값으로 학습하고, 학습 결과를 이용하여 텍스트/음성 변환기에서 문장단위의 에너지 컨투어를 생성하는 방식을 통해 문장내 에너지 변화를 제어함으로써 합성음의 자연성이 향상되므로 텍스트/음성 변환기의 자연성이 요구되는 응용분야인 통신 서비스, 사무 자동화, 교육 등의 여러 분야에 응용할 수 있는 효과가 있다.

    극성이 다른 가변길이 듀얼 임펄스의 스펙트럼 하모닉스 매칭에 의한 피치 검출 방법
    3.
    发明授权
    극성이 다른 가변길이 듀얼 임펄스의 스펙트럼 하모닉스 매칭에 의한 피치 검출 방법 失效
    通过具有不同极性的可变长度双重脉冲的频谱谐波匹配的检测方法

    公开(公告)号:KR100128851B1

    公开(公告)日:1998-10-01

    申请号:KR1019940036135

    申请日:1994-12-23

    Abstract: 본 발명은 음성신호의 최대피치값과 최소피치값을 초기화하는 단계(81); 음성신호를 샘플링하여 디지털 신호로 변환한 다음, 방형 창함수의 길이(w)를 최대피치의 2배로하여 w개의 음성 샘플을 입력하는 단계(82); 듀얼 임펄스의 변화폭(N)을 최소피치 길이로 정의 하는 단계(83); 음성신호와 상기 듀얼 임펄스의 변화폭(N)을 컨버류션하여 에너지 변환 함수 Ec(n)을 구한 후 에너지 변환 함수 Ec(n)의 모든 진폭의 절대값을 합하여 듀얼 임펄스의 변화폭(N)에 따른 에너지 변환 함수 Ef(N)을 산출하는 단계(84); 듀얼 임펄스의 변화폭(N)이 최대 피치값 보다 클때까지 상기 Ef(N)산출을 반복하는 단계(85'); 두얼 임펄스의 변화폭(N)이 최대 피치값 보다 크면 최대피치의 Ef(N)값과 최소피치의 Ef(N)에 의한 문턱값을 산출하고 산출된 문턱값보다 작은 골중에서 듀얼 임펄스이 변화폭이 작은 순서대로 3개의 골을 구하는 단계(86); 상기 구해진 골의 수에 따라 피치를 정의 하는 단계(87)를 포함하는 것을 특징으로 하는 가변길이 듀얼 임펄스의 스펙트럼 하모닉스 매칭에 의한 피치 검출방법에 관한 것으로, 음성합성, 인식, 부호화 분야에서 발성자에 따른 영향을 받지 않고 음성신호를 정확히 분석하는 효과가 있다.

    유성음 구간에서 프레임별 피치 검출 방법

    公开(公告)号:KR1019980037190A

    公开(公告)日:1998-08-05

    申请号:KR1019960055906

    申请日:1996-11-21

    Inventor: 강동규 한민수

    Abstract: 본 발명은 음성 신호 처리 방법에 관한 것으로, 약 500㎐로 저역 통과된 유성음 신호에서 인접한 영교차점 구간별 면적을 산출하고 인접한 면적의 합을 구하여 피치를 검출하기 용이한 진폭 변화를 피크를 산출한다. 그리고 분석 프레임 내에서 대표적인 진폭 변화 피크의 수에 따라 분석 프레임의 길이를 재설정한 후 임의의 두 진폭 변화 피크의 크기에 대한 유사도를 두 피크의 거리에 대한 분포로 나타내고 최대 분포 봉우리의 중심 거리를 측정하여 분석 구간 내에서의 피치 및 후보 피치를 검출한다. 또한 전체 음성 신호의 피치 윤곽선에서 프레임별 피치 변화치를 참조로 예상 검출에러 구간에 대해 후보 피치를 이용하여 에러를 수행한다. 이렇게 함으로서 보다 정확한 피치를 검출할 수 있고 광범위한 피치의 분포와 변화에 적응이 용이할 뿐 아니라 고속 처리가 가능한 유성음 구간에서 프레임별 피치 검출 방법이 제시된다.

    다이폰 단위를 이용한 엘에스피(LSP)방식의 음성 합성 방법
    5.
    发明公开
    다이폰 단위를 이용한 엘에스피(LSP)방식의 음성 합성 방법 失效
    采用Diphone单元的LSP方法的语音合成方法

    公开(公告)号:KR1019960024888A

    公开(公告)日:1996-07-20

    申请号:KR1019940036104

    申请日:1994-12-22

    Abstract: 본 발명은 한국어 문자를 음성으로 합성하는 방법에 대한 것으로서, 음성을 다이폰 단위로 세분하여 합성 데이타베이스로부터 파라미터를 가져와서 LSP합성방식으로 음성으로 변환하는 방법이다. 본 발명에 사용한 특징으로는 다이폰 단위로의분류와 결합을 효율적으로 세분화하였으며 합성 데이타베이스를 구성하는 경우 각각의 다이폰에 대해서 특수한 경계표시를 하였다. 각각의 경계표시는 다이폰의 유형에 따라서 서로 다른 의미를 가지며 합성단위들을 결합하는 경우 길이의 조절과 결합이 용이하도록 구성하였다. 또한 음성합성기술의 관건은 합성음의 품질이므로 LSP 합성필터의 음원으로 수정된LF 모델과 리지쥬얼(residual)신호를 사용하여 자연성과 명료성을 높이고자 하였다.
    본 발명은 현재 늘어가는 정보 통신 서비스와 연결될 경우 합성기술을 이용한 정보검색의 급증으로 새로운 정보제공 기술의 증진을 가져오는 효과를 가진다.

    음운환경과 묵음구간 길이를 이용한 텍스트/음성변환 장치 및그 방법
    6.
    发明授权
    음운환경과 묵음구간 길이를 이용한 텍스트/음성변환 장치 및그 방법 失效
    음운환경과묵음구간길이를이용한텍스트/음성변환장치및그방

    公开(公告)号:KR100373329B1

    公开(公告)日:2003-02-25

    申请号:KR1019990033869

    申请日:1999-08-17

    Abstract: PURPOSE: An apparatus and a method for changing text/speech using phoneme environment and mute section are provided to improve clearness and nature of compound sound by using mute period length information for selecting the compound unit. CONSTITUTION: The apparatus for changing text/speech using phoneme environment and mute section includes following units. A language processing unit(21) extracts phoneme stream and sentence structure information from the text being inputted. A rhythm processing unit(22) receives the phoneme stream and sentence structure information and estimates a rhythm control parameter value by using a rule and rhythm table. A compound unit database(24) stores sound pieces corresponding to the searching information of compound unit. A signal processing unit(23) produces a compound unit searching information, selects the stored candidate sound pieces and then produces a desired compound sound by compounding the selected sound pieces.

    Abstract translation: 目的:提供一种使用音素环境和静音部分来改变文本/语音的装置和方法,以通过使用静音周期长度信息来选择复合单元来改善复合声音的清晰度和性质。 组成:使用音素环境和静音部分改变文本/语音的装置包括以下单元。 语言处理单元(21)从输入的文本中提取音素流和句子结构信息。 节奏处理单元(22)接收音素流和句子结构信息,并通过使用规则和节奏表来估计节奏控制参数值。 复合单元数据库(24)存储对应于复合单元的搜索信息的声音片段。 信号处理单元(23)产生复合单元搜索信息,选择存储的候选声音片段,然后通过复合所选择的声音片段来产生期望的复合声音。

    그래픽 사용자 인터페이스를 이용한 합성 음성 분석 방법
    7.
    发明授权
    그래픽 사용자 인터페이스를 이용한 합성 음성 분석 방법 失效
    一种使用图形用户界面分析合成语音的方法

    公开(公告)号:KR100340690B1

    公开(公告)日:2002-06-20

    申请号:KR1019990039869

    申请日:1999-09-16

    Abstract: 1. 청구범위에기재된발명이속한기술분야본 발명은그래픽사용자인터페이스를이용한합성음성분석방법에관한것임. 2. 발명이해결하려고하는기술적과제본 발명은하나의음편에대하여여러개의후보가있는고품질음성합성기의합성음을그래픽사용자인터페이스를이용하여보다효율적으로분석하기위한합성음성분석방법및 그기록매체를제공하는데그 목적이있음. 3. 발명의해결방법의요지본 발명은, 전체합성음에대한기본주파수궤적, 각인접한음편간의스펙트럼차이및 음편경계를음성파형에동기시켜그래픽사용자인터페이스를이용하여표시하는제 1 단계; 전체음성파형에서선택된하나의음편후보에대한기본주파수분포, 지속시간분포및 포먼트에의해합성단위후보의분포를나타낸후에현재의음편과인접한음편위치를분포도위에나타내는제 2 단계; 및선택된음편의분포도에서원하는임의의특성을선택하여현재의합성된음편을교체한후에교체된합성파형을음성으로출력하는제 3 단계를포함한다. 4. 발명의중요한용도본 발명은음성합성기의성능분석에이용됨.

    그래픽 사용자 인터페이스를 이용한 합성 음성 분석 방법
    8.
    发明公开
    그래픽 사용자 인터페이스를 이용한 합성 음성 분석 방법 失效
    使用图形用户界面分析合成声音的方法

    公开(公告)号:KR1020010027891A

    公开(公告)日:2001-04-06

    申请号:KR1019990039869

    申请日:1999-09-16

    Abstract: PURPOSE: An analyzing method for synthetic sound and a recording medium thereof are provided to efficiently analyze the synthetic sound of a high quality sound synthesizer using a graphic user interface. CONSTITUTION: Synthetic sound is analyzed by indicating the track of a reference frequency about entire synthetic sound, the spectrum difference between each adjacent sound piece and the edge of the sound pieces using a graphic user interface after synchronizing the frequency, the spectrum difference and the edge with a sound wave form; by indicating the position of a sound piece contiguous to a present sound piece on a distribution chart after indicating the reference frequency distribution and the continuous time distribution of one selected sound piece and indicating a synthetic unit waiting list distribution by a formant; and by exchanging the present synthetic sound piece with the optional property of the selected sound piece and outputting a synthetic wave form as sound.

    Abstract translation: 目的:提供合成声音的分析方法及其记录介质,以便使用图形用户界面来有效地分析高质量声音合成器的合成声音。 规定:合成声音通过在同步频率,频谱差和边缘之间通过使用图形用户界面指示关于整个合成声音的参考频率的轨迹,每个相邻声部之间的频谱差和声音片的边缘 具有声波形式; 通过在指示参考频率分布和一个所选声音的连续时间分布并且表示共同体的合成单元等待列表分配之后,指示在分布图上与当前音片相邻的声音片段的位置; 并且通过使用所选择的声音片的可选属性交换当前的合成声音片并输出合成波形作为声音。

    유성음 구간에서 피치동기식 포먼트 추정방법
    9.
    发明授权
    유성음 구간에서 피치동기식 포먼트 추정방법 失效
    提取语音同声传译的方法

    公开(公告)号:KR100211965B1

    公开(公告)日:1999-08-02

    申请号:KR1019960068952

    申请日:1996-12-20

    Inventor: 강동규 한민수

    Abstract: 본 발명은 유성음 구간에서 피치동기식 포먼트(formant) 추정방법에 관한 것이다. 그 목적은 선형예측(Linear Prediction) 기법으로 음성신호의 유성음구간에서 피치(pitch) 길이에 관계없이 음원에 의한 영향을 최소화하면서 정밀한 포먼트 정보를 추출하는 데에 있다.
    그 특징은 에포크(epoch)를 참조하여 분석구간의 길이를 결정하는 단계와, 선택된 분석구간 내에서 각각의 성문열림 구간 중 에포크로부터 해당 피치의 20% 내외의 구간을 '0'으로 대치하고 선형예측(공분산 혹은 자기 상관계수방법 등) 분석을 수생하는 단계와, 산출된 선형예측계수를 이용하여 '0'으로 대치된 각각의 성문열림 구간을 선형 예측된 값으로 음성을 합성하여 대치함으로써 성문파(음원)의 영향이 줄어든 임펄스 응답신호에 가까운 신호로 변환하고 다시 선형예측 계수를 산출하는 단계와, 선형예측 분석단계에서 산출된 선형예측 계수를 이용하여 성문열림 구간을 피치의 30% 내외까지 확장하여 성문파의 영향을 더욱 억제하여 보다 임펄스 응답신호에 가까운 신호로 변환한 다음 최종적인 선형예측 분석을 수행하여 포먼트 정보를 추출하는 � ��계 및 전체 음성신호에 대해 상기 단계들을 모두 수행하여 얻은 포먼트 궤적에 대하여 피티 주기별로 포먼트의 변화치를 산출하여 그 값이 200Hz를 초과할 경우에 에러발생 여부를 확인하고 궤적의 밀림현상을 보정하여 최종적인 포먼트 궤적을 구하는 단계로 이루어지는 데에 있다.

    문자-음성변환 서비스 장치 및 그 제어 방법
    10.
    发明公开
    문자-음성변환 서비스 장치 및 그 제어 방법 失效
    文本到语音转换服务设备及其控制方法

    公开(公告)号:KR1019970056695A

    公开(公告)日:1997-07-31

    申请号:KR1019950055898

    申请日:1995-12-23

    Abstract: 본 발명은 정보제공자들에게 접속하여 전자식전화기 가입자들에게 문자도된 메뉴와 정보를 음성으로 변환하여 전화기를 통해서 합성된 음성으로 들려주는 문자-음성변환 서비스 장치 및 그 제어 방법에 관한 것으로, 외부의 전화망접속부(1)에 접속되는 가입자접속수단(10), 상기 가입자접속수단(10)에 접속되는 중앙처리수단(20), 상기 중앙처리수단(20)과 외부의 패킷망접속부(3) 사이에 접속되는 데이터처리수단(30)을 구비하는 것을 특징으로 하는 문자-음성변환 서비스 장치와, 이에 적용되는 문자-음성변환 서비스 제어 방법에 있어서, 상기 가입자접속수단(10)으로 부너 호가 발생하면 중앙처리수단(20)이 상기 패킷망접속부(3)를 통해 정보제공자와 접속하여 데이터를 수신하는 제1단계; 상기 수신한 데이터를 분석하여 현재 상태가 서비스 해제가 아니면 메뉴를 선택하는 단계인가를 분석하는 제2단계; 상기 메뉴선택단계 여부에 따라 메뉴 데이터를 수신하고 합성음를 생성하거나 자료정보를 검출하여 해당하는 합성음을 생성, 전송하는 제3단계; 및 사용자가 누른 DTMF 신호를 수신하여 데이터처리수단(30)을 통해 정보제공자에게 다음 상태로 넘어가기 위한 명령을 전송하는 제4단계를 포함하는 것을 특징으로 하는 문자-음성변환 서비스 제어 방법은 문자를 음성으로 변환하여 이용자들에게 음서의 형태로 정보를 제공할 수 있는 효과가 있다.

Patent Agency Ranking