-
公开(公告)号:KR1020050063990A
公开(公告)日:2005-06-29
申请号:KR1020030095250
申请日:2003-12-23
Applicant: 한국전자통신연구원
IPC: G06F17/28
Abstract: 본 발명은 기계번역을 위한 번역단위 추출/검색장치 및 방법에 관한 것으로, 코퍼스에서 기계번역의 기본단위가 되는 형태소 연쇄열을 추출하고, 이들을 검색해 내어 번역을 요하는 입력문장의 기계번역 수행과정에서 번역단위를 이용한 번역을 수행함으로써 번역 성공률을 높일 수 있도록 하는 것이다.
이에, 본 발명은 코퍼스를 대상으로 문장의 형태소를 분석하고, 상기 형태소 분석결과에 의해 번역단위 후보를 검색하여 결과를 저장하고 빈도를 기록하는 번역단위 후보 추출모듈과, 상기 번역단위 후보 추출모듈의 번역단위 후보들로부터 기본 번역단위를 선정하고, 선정된 기본 번역단위를 저장하는 기본 번역단위 선정/저장모듈 및 입력문장에서 형태소를 분석하고, 기본 번역단위 데이터베이스로부터 상기 입력문장의 기본 번역단위를 찾아내는 온라인 번역단위 검색모듈로 구성되는 것을 특징으로 한다.-
公开(公告)号:KR1020040050394A
公开(公告)日:2004-06-16
申请号:KR1020020078215
申请日:2002-12-10
Applicant: 한국전자통신연구원
IPC: G10L13/00
Abstract: PURPOSE: A translation engine device for translating a source language into an object language and a translation method therefor are provided to use a dialogue sentence in several domain environment and accurately translate the source language inputted by a user into the object language. CONSTITUTION: A mapping table(408) stores a cluster of an object language mapped with a cluster of a source language. A DTST(Direct Translation Sentence Table) direct translation unit(401) directly translates a sentence capable of direct translation in an inputted source language sentence. A pre-processing module(402) maintains a kernel language of the source language sentence through the morpheme analysis of the source language sentence, hides the other portions, and simplifies the structure of the sentence. A clustering unit(404) divides the source language sentence into clusters. A mapping unit(405) decides the cluster of the object language mapped to the cluster of the source language using the mapping table(408). A post-processing and generating unit(406) reallocates the order of the clusters of the object language, and recovers the object language as a completed sentence form.
Abstract translation: 目的:提供用于将源语言翻译成对象语言的翻译引擎设备及其翻译方法,以在多个域环境中使用对话语句,并将用户输入的源语言准确地翻译成对象语言。 构成:映射表(408)存储与源语言的集群映射的对象语言的集群。 DTST(直译翻译句)直接翻译单元(401)直接翻译能够在输入的源语言句中直接翻译的句子。 预处理模块(402)通过源语句的语素分析维护源语言句的内核语言,隐藏其他部分,并简化了句子的结构。 聚类单元(404)将源语句划分成簇。 映射单元(405)使用映射表(408)来确定映射到源语言的集群的对象语言的集群。 后处理和生成单元(406)重新分配对象语言的簇的顺序,并将对象语言恢复为完整的句子形式。
-
-
公开(公告)号:KR1020150027465A
公开(公告)日:2015-03-12
申请号:KR1020130105820
申请日:2013-09-04
Applicant: 한국전자통신연구원
IPC: G10L15/06
CPC classification number: G10L15/187
Abstract: 본 발명에 따른 외국어 고유명사에 대한 다중 발음열 생성 방법은, 제1언어로 표현된 제2언어 고유명사를 자동 번역기를 통하여 제2언어 단어로 변환하는 단계; 제2언어 G2P를 통하여 상기 제2언어 단어에 대응하는 제2언어 발음열을 생성하는 단계; 상기 제2언어 발음열을 제1언어 발음열로 변환하는 단계; 제1언어 G2P를 통하여 상기 제1언어로 표현된 제2언어 고유명사에 대응하는 제1언어 발음열을 생성하는 단계; 및 상기 제1언어 발음열로 변환하는 단계를 통하여 얻어진 제1언어 발음열과 상기 제1언어 발음열을 생성하는 단계를 통하여 얻어진 제1언어 발음열을 이용하여 복수의 발음열들을 생성하는 단계를 포함하는 것을 특징으로 한다.
Abstract translation: 根据本发明,一种用于为外国专有名词产生多个发音的方法包括:通过自动翻译器将以第一语言表达的第二语言专有名词转换为第二语言词的步骤; 通过第二语言G2P生成与第二语言词相对应的第二语言发音的步骤; 将第二语言发音转换为第一语言发音的步骤; 通过第一语言G2P生成与以第一语言表示的第二语言专有名词相对应的第一语言发音的步骤; 以及使用通过转换成通过产生第一语言发音的步骤获得的第一语言发音和第一语言发音的步骤而获得的使用第一语言发音来生成多个发音的步骤。
-
45.
公开(公告)号:KR101449551B1
公开(公告)日:2014-10-14
申请号:KR1020110106952
申请日:2011-10-19
Applicant: 한국전자통신연구원
CPC classification number: G06F17/2827 , G06F17/30684
Abstract: 통상적인 유사문장 검색 기술은, 입력부, 유사도 계산부, 출력부 등으로 구성되며, 유사도 계산부의 결과인 문장 유사도 확률값이 동일하게 발생될 수 있다. 유사도 계산 결과가 입력문장과 완전히 일치하는 경우에는 1순위로 순위를 조정하면 되지만, 완전히 일치하지 않을 경우에는 동일한 확률값을 가진 문장들 중에서 어느 것을 상위로 결정하느냐에 대한 문제가 발생한다. 이를 위해 다양한 확률값을 활용한 유사문장 검색의 순위 재조정 기법이 있으나, 번역된 제2 언어에 대한 순위 재조정 기법은 전무한 실정이다. 이에 본 발명의 실시예에서는, 문장간 유사도 측정시 검색된 문장들의 순위를 재조정하여 입력문장과 유사가 높은 최적의 문장을 제공함으로써 유사 문장검색 기술 성능을 향상시킬 수 있는 유사문장 검색 기술을 제안하고자 한다.
-
公开(公告)号:KR1020140093459A
公开(公告)日:2014-07-28
申请号:KR1020130005844
申请日:2013-01-18
Applicant: 한국전자통신연구원
Abstract: An automatic translation method of the present invention may comprise the steps of authenticating a facial image of a user through the comparison of multiple facial feature vectors and facial image templates which are related to the preset facial image after obtaining the facial image of the user; extracting voice features after separation of the voice segment from the input audio signal; converting the extracted voice features to text sentences by using an acoustic model constructed by speaker adaptation; converting the converted text sentence to target language sentences by using an automatic translation engine; and converting the converted target language sentence to target language voice by using a voice synthesis engine and outputting the target language voice.
Abstract translation: 本发明的自动翻译方法可以包括以下步骤:通过在获得用户的面部图像之后通过比较与预设面部图像相关的多个面部特征向量和面部图像模板来认证用户的面部图像; 在分离语音段与输入音频信号之后提取语音特征; 通过使用由说话者适应构成的声学模型将所提取的语音特征转换成文本句子; 通过使用自动翻译引擎将转换的文本句子转换为目标语言句子; 以及通过使用语音合成引擎将所转换的目标语言句子转换为目标语言语言并输出目标语言语言。
-
47.
公开(公告)号:KR101412657B1
公开(公告)日:2014-06-27
申请号:KR1020100119654
申请日:2010-11-29
Applicant: 한국전자통신연구원
Abstract: 본 발명은 두 대 이상의 휴대형 자동 통역 단말기간 상호 통신을 이용한 자동 통역 성능 향상 방법 및 그 장치에 관한 것이다. 본 발명은 자동 통역기를 이용해 통역이 이루어지는 상황에서 각 개인이 소지하고 있는 휴대형 자동 통역 단말기 상호간에 통신을 통하여 자동 통역 성능 향상에 도움을 줄 수 있는 정보를 교환함으로써 자동 통역 성능을 높일 수 있도록 하는 것을 특징으로 한다. 이에 따라, 본 발명은 상대방 휴대형 자동 통역 단말기로부터 자동 통역 성능 향상에 도움이 될 수 있는 사용자 언어 정보, 통역 대상 영역 정보, 잡음 신호 정보, 통역 결과 문장 등을 전달받아 이를 자동 통역 단말기의 환경 설정, 음성 인식, 기계 번역, 음성 합성 과정에 활용하여 자동 통역 성능을 높일 수 있도록 한다.
-
公开(公告)号:KR101377459B1
公开(公告)日:2014-03-26
申请号:KR1020090127709
申请日:2009-12-21
Applicant: 한국전자통신연구원
CPC classification number: G06F17/2854
Abstract: 자동 통역 장치가 제공된다. 이 자동 통역 장치는 제 1 언어 음성을 입력받고, 음성 인식 과정을 거쳐 제 1 언어 문장을 생성하는 음성 인식부, 상기 생성된 제 1 언어 문장에 포함된 요소를 추출하는 언어 처리부, 기 번역문장이 저장된 기 번역문장 데이터베이스를 참조하여, 상기 추출된 요소와 상기 기 번역문장에 포함된 요소를 비교하고, 비교 결과에 근거하여 상기 제 1 언어 문장과 상기 기 번역문장 간의 유사도를 계산하는 유사도 계산부, 상기 계산된 유사도에 따라 상기 기 번역문장 데이터베이스를 참조하여 상기 제 1 언어 문장을 제 2 언어 문장으로 번역하는 문장 번역부 및 상기 번역된 제 2 언어 문장에 대응하는 음성 데이터를 검출하고, 검출된 음성 데이트를 합성하여, 상기 제 2 언어 문장에 대응하는 아날로그 형태의 음성 신호를 출력하는 음성 합성부를 포함한다.
-
公开(公告)号:KR101373053B1
公开(公告)日:2014-03-11
申请号:KR1020100064857
申请日:2010-07-06
Applicant: 한국전자통신연구원
CPC classification number: G06F17/289 , G10L15/26 , G10L25/78
Abstract: 본 발명은 문장 번역 장치 및 그 방법에 관한 것으로, 제1 언어의 음성에 대한 음성 인식 결과에 근거하여 제1 언어의 문장을 생성하는 음성 인식부, 제1 언어의 문장으로부터 형태소 품사를 태깅하는 형태소 품사 태깅부, 제1 언어의 음성으로부터 퍼즈(pause) 정보를 추출하는 퍼즈 추출부, 및 형태소 품사 태깅부에 의해 태깅된 형태소 품사 정보와 퍼즈 추출부에 의해 추출된 퍼즈 정보에 근거하여 제1 언어의 문장에 대해 문장 분리하는 문장 분리부를 포함한다. 본 발명에 따르면, 문장 번역을 위해 문장을 분리하는데 있어서 형태소 정보뿐만 아니라 음성에 대한 퍼즈(pause) 정보를 활용함으로써 보다 정확한 문장 분리가 가능한 이점이 있다.
-
公开(公告)号:KR1020120004151A
公开(公告)日:2012-01-12
申请号:KR1020100064857
申请日:2010-07-06
Applicant: 한국전자통신연구원
CPC classification number: G06F17/289 , G10L15/26 , G10L25/78
Abstract: PURPOSE: A sentence translating device and a method thereof are provided to use morpheme information and pause information about a voice, thereby accurately separating a sentence. CONSTITUTION: A voice recognizing unit(20) generates a sentence of a first language based on a voice recognition result about a voice of the first language. A morpheme part-of-speech tagger(40) tags a morpheme part-of-speech from a sentence of the first language. A pause extracting unit(30) extracts pause information from the voice of the first language. A sentence separating unit(50) applies pause information whose length is longer than a threshold value when the sentence of the first language is separated.
Abstract translation: 目的:提供句子翻译装置及其方法,以使用语素信息和暂停关于语音的信息,从而准确地分离句子。 构成:语音识别单元(20)基于关于第一语言的语音的语音识别结果生成第一语言的句子。 词素标注器(40)的语素从第一语言的句子中标注语素部分。 暂停提取单元(30)从第一语言的语音中提取暂停信息。 当分离第一语言的句子时,句子分离单元(50)应用长度大于阈值的暂停信息。
-
-
-
-
-
-
-
-
-