-
公开(公告)号:KR100327109B1
公开(公告)日:2002-03-07
申请号:KR1019990061893
申请日:1999-12-24
Applicant: 한국전자통신연구원
IPC: G06F17/26
Abstract: 본발명은, 음절단위조건확률을이용한한국어자동띄어쓰기방법과, 이를실현시키기위한프로그램을기록한컴퓨터로읽을수 있는기록매체에관한것으로, 어휘지식또는발견적교수법(heuristic)을사용하지않고통계적인방법을사용하여띄어쓰기가일부되어있는문장또는띄어쓰기가전혀되어있지않은문장에대해서띄어쓰기를처리할수 있는음절단위조건확률을이용한한국어자동띄어쓰기방법과, 이를실현시키기위한프로그램을기록한컴퓨터로읽을수 있는기록매체를제공하며, 표준문장코퍼스로부터통계처리를통하여음절간천이확률을설정하는제 1 단계; 상기설정된확률에의거하여띄어쓰기처리대상문장에포함된음절열에대하여첫 번째음절부터시작하여, 각음절사이에띄어쓰기를하는경우와안하는경우를나누어모든경우의조합에의하여누적로그확률을순차적으로계산하는제 2 단계; 및상기제 2 단계의계산된결과에의하여, 최대누적로그확률에해당하는경로를선택하여백 포인터를이용하여입력된음절의띄어쓰기최적패턴을탐색하여출력스트링을획득하는제 3 단계를수행한다.
-
公开(公告)号:KR1020010076625A
公开(公告)日:2001-08-16
申请号:KR1020000003876
申请日:2000-01-27
Applicant: 한국전자통신연구원
IPC: G10L13/00
Abstract: PURPOSE: An unnecessary synthetic unit removing method for lightweight of synthetic database is provided to decrease a memory size, and to improve a speed of a synthetic system by removing an unnecessary synthetic unit having a slight influence upon a synthetic tone quality. CONSTITUTION: A voice synthesizer is performed by inputting a high capacity text corpus to a synthesizer(S101). At this time, because a synthetic method of the synthesizer selects and connects a synthetic unit on-line, an optimized synthetic unit selection module is used. The synthetic unit selection module selects an optimized synthetic unit candidate line by means of a DP(Dynamic Programming) distance calculation between parameters of synthetic unit. The DP distance calculation is that the degree of similarity is calculated at a boundary between the parameters of synthetic unit. Because the synthetic tone quality is decided, a weight of the parameter is tuned through a sense of hearing test before a frequency is found out in order to select a synthetic unit having an optimized synthetic tone quality(S102). After this, a sentence is inputted, and the DP distance calculation is performed by the synthetic unit selection module, and in the result of the calculation, the optimized synthetic unit line having the highest degree of similarity is selected(S103), and the synthetic unit candidate for being used in a generation of the synthetic sound is extracted. Next, an accumulated frequency of use is calculated, and a maximum frequency of the candidate to be removed is decided(S105). At this time, the accumulated frequency of use is used in the time of the synthetic sound of the final synthetic unit candidate. Finally, the synthetic unit candidate having smaller frequency than the maximum frequency is removed at the high capacity text corpus, and before and the synthetic tone quality is compared after a removal of the synthetic unit(S106,S107).
Abstract translation: 目的:提供一种用于轻量化合成数据库的不必要的合成单元去除方法以减少存储器大小,并且通过去除对合成色调质量有轻微影响的不必要的合成单元来提高合成系统的速度。 构成:通过向合成器输入高容量文本语料库来执行语音合成器(S101)。 此时,由于合成器的合成方法在线选择合成单元,所以使用优化的合成单元选择模块。 合成单元选择模块通过合成单元参数之间的DP(动态编程)距离计算来选择优化的合成单元候选线。 DP距离计算是在合成单位的参数之间的边界处计算相似度。 由于合成音调质量被决定,所以在找出频率之前通过听觉测试来调整参数的权重,以便选择具有优化的合成音质的合成单元(S102)。 之后,输入一个句子,并通过合成单元选择模块执行DP距离计算,并且在计算结果中,选择具有最高相似度的优化合成单元线(S103),并且合成 提取用于生成合成声音的单元候选。 接下来,计算累积的使用频率,决定要移除的候选者的最大频率(S105)。 此时,在最终合成单位候选人的合成声音时使用累积的使用频率。 最后,在高容量文本语料库中除去具有比最大频率小的频率的合成单元候选,并且在除去合成单元之前比较合成音质之前(S106,S107)。
-
-
-
公开(公告)号:KR101578766B1
公开(公告)日:2015-12-22
申请号:KR1020110090283
申请日:2011-09-06
Applicant: 한국전자통신연구원
IPC: G10L15/08
Abstract: 본발명은선택적포즈가삽입될단어목록을기반으로요소 WFST를구성함으로써, 음성인식의성능을떨어뜨리지않으면서탐색공간의크기증가를최소화할수 있는음성인식용탐색공간생성장치및 방법에관한것이다.이를위하여본 발명은발음사전과, 선택적포즈가삽입될단어목록을저장하고있는단어목록데이터베이스와, 상기발음사전으로부터읽어들인각 단어의발음열을이용하여탐색공간을생성하되, 상기읽어드린단어가상기단어목록데이터베이스에포함된경우상기읽어드린단어에선택적포즈를삽입시켜탐색공간을생성하는탐색공간구현부와, 상기선택적포즈가삽입된탐색공간이저장된데이터베이스를포함하는음성인식용탐색공간생성장치를제공한다.
-
76.
公开(公告)号:KR101253104B1
公开(公告)日:2013-04-10
申请号:KR1020090081936
申请日:2009-09-01
Applicant: 한국전자통신연구원
CPC classification number: G06F17/2755 , G06F17/2785 , G10L15/1815
Abstract: 본 발명은 예제 기반 의미 표현 패턴을 이용하여 입력 음성에 대응하는 의미 표현을 출력하는 음성 이해 기법에 관한 것으로, 입력된 음성에 대한 음성 인식 결과에 따라 형태소 분석을 수행한 후, 각종 부가 정보를 인식 및 추출하여 저장하고, 구문을 분석한 후에, 그 결과에 따라 층위를 기술하며, 클래스 변환을 수행한 후에, 수의적 표현, 무의미한 표현, 부가 정보를 변환 또는 삭제하여 기본형으로 변환하고, 형태소 태그 또는 기호를 삭제하여 의미 표현을 결정하고, 결정된 의미 표현이 예제 기반 의미 표현 패턴 데이터베이스에 존재하는지의 여부에 따라 음성 인식 결과를 출력하거나 문장을 생성하여 출력하거나 검색된 의미 표현과 부가 정보를 출력함으로써, 음성 인식 응용 시스템에 최적화된 의미 표현을 출력할 수 있는 것이다.
음성 인식, 음성 이해, 의미 표현-
公开(公告)号:KR1020130026855A
公开(公告)日:2013-03-14
申请号:KR1020110090283
申请日:2011-09-06
Applicant: 한국전자통신연구원
IPC: G10L15/08
Abstract: PURPOSE: A search space generator for recognizing voice is provided to improve the accuracy of voice recognition by recognizing the voice by using a voice articulation database for training a voice model. CONSTITUTION: A search space generator for recognizing voice includes a pronunciation dictionary(100), a word list database(120), a WFST(Weighted Finite State Transducer) L realization unit(140), and a WFST L database(160). The WFST L implementation unit acquires a pronunciation string for each word by reading the pronunciation dictionary. The WFST L implementation unit generates WFST L in which a selective pause is inserted by comparing the acquired pronunciation dictionary with the word list stored in the word list database. [Reference numerals] (100) Pronunciation dictionary; (120) Word list database; (140) WFST L realization unit; (160) WFST L database
Abstract translation: 目的:提供用于识别语音的搜索空间发生器,以通过使用用于训练语音模型的语音发音数据库识别语音来提高语音识别的准确性。 构成:用于识别语音的搜索空间发生器包括发音字典(100),单词列表数据库(120),WFST(加权有限状态传感器)L实现单元(140)和WFST L数据库(160)。 WFST L实现单元通过读取发音字典获取每个单词的发音字符串。 WFST L实现单元产生WFST L,其中通过将获取的发音字典与存储在单词列表数据库中的单词列表进行比较来插入选择性暂停。 (附图标记)(100)发音字典; (120)词汇表数据库; (140)WFST L实现单元; (160)WFST L数据库
-
公开(公告)号:KR101178801B1
公开(公告)日:2012-08-31
申请号:KR1020080124371
申请日:2008-12-09
Applicant: 한국전자통신연구원
IPC: G10L15/10 , G10L15/28 , G10L21/0272 , G10L15/20
CPC classification number: G10L15/20 , G10L21/0272 , G10L2021/02166
Abstract: 본 발명은 음원분리 및 음원식별을 이용한 음성인식 기술에 관한 것으로, 음성인식기 사용자의 음성과 잡음 음원들이 혼재하는 환경에서 다수의 마이크와 독립요소분석 기법을 이용하여 각각의 원음을 분리하고, 이를 바탕으로 고성능의 음성인식을 수행하는 것이다. 독립요소분석에 의해 분리된 음원들 가운데 음성인식기 사용자가 음성인식기 구동을 목적으로 발성한 음성을 음성인식기가 자동으로 구분해내기 위해, 본 발명에서는 분리된 음원들의 음성인식 신뢰도 및 방향정보를 계산하고, 잡음 음원의 경우 움직이지 않는다고 가정한다. 이 방식에 의하면 음성인식기 사용자의 주변에 복수 개의 잡음원이 존재하는 경우에도 사용자는 마이크 배열과의 상대적인 위치에 무관하게 자유로운 위치에서 발성할 수 있으며, 높은 음성인식 성능을 얻을 수 있다.
마이크배열, 음성인식, 잡음처리, 음원분리, 음원식별, 독립요소분석(ICA)-
公开(公告)号:KR101149521B1
公开(公告)日:2012-05-25
申请号:KR1020080125524
申请日:2008-12-10
Applicant: 한국전자통신연구원
IPC: G10L15/183 , G06F17/28
CPC classification number: G10L15/1815 , G10L15/183
Abstract: A speech recognition method using a domain ontology includes: constructing domain ontology DB; forming a speech recognition grammar using the formed domain ontology DB; extracting a feature vector from a speech signal; modeling the speech signal using an acoustic model. The method performs speech recognition by using the acoustic model, the speech recognition dictionary and the speech recognition grammar on the basis of the feature vector.
-
公开(公告)号:KR101134455B1
公开(公告)日:2012-04-13
申请号:KR1020090057093
申请日:2009-06-25
Applicant: 한국전자통신연구원
IPC: G10L15/197 , G10L15/14 , G10L15/06
Abstract: PURPOSE: A speech recognition apparatus and a method thereof are provided to reduce error of remote speech recognition. CONSTITUTION: A syntax analyzing unit(23) analyzes syntax based on a morpheme word class to generate a hierarchical structure. A hierarchical word list generating unit(24) generates a word list by a hierarchy of a recognition word using the hierarchical structure. A hierarchical n-gram applying unit(25) generates a hierarchical n-gram score of the word list by a hierarchy. A calculation unit(27) adds the hierarchical n-gram score to sound and language model probability to generate a speech recognition score of the recognition word.
-
-
-
-
-
-
-
-
-