-
公开(公告)号:KR1020140093459A
公开(公告)日:2014-07-28
申请号:KR1020130005844
申请日:2013-01-18
Applicant: 한국전자통신연구원
Abstract: An automatic translation method of the present invention may comprise the steps of authenticating a facial image of a user through the comparison of multiple facial feature vectors and facial image templates which are related to the preset facial image after obtaining the facial image of the user; extracting voice features after separation of the voice segment from the input audio signal; converting the extracted voice features to text sentences by using an acoustic model constructed by speaker adaptation; converting the converted text sentence to target language sentences by using an automatic translation engine; and converting the converted target language sentence to target language voice by using a voice synthesis engine and outputting the target language voice.
Abstract translation: 本发明的自动翻译方法可以包括以下步骤:通过在获得用户的面部图像之后通过比较与预设面部图像相关的多个面部特征向量和面部图像模板来认证用户的面部图像; 在分离语音段与输入音频信号之后提取语音特征; 通过使用由说话者适应构成的声学模型将所提取的语音特征转换成文本句子; 通过使用自动翻译引擎将转换的文本句子转换为目标语言句子; 以及通过使用语音合成引擎将所转换的目标语言句子转换为目标语言语言并输出目标语言语言。
-
公开(公告)号:KR101377459B1
公开(公告)日:2014-03-26
申请号:KR1020090127709
申请日:2009-12-21
Applicant: 한국전자통신연구원
CPC classification number: G06F17/2854
Abstract: 자동 통역 장치가 제공된다. 이 자동 통역 장치는 제 1 언어 음성을 입력받고, 음성 인식 과정을 거쳐 제 1 언어 문장을 생성하는 음성 인식부, 상기 생성된 제 1 언어 문장에 포함된 요소를 추출하는 언어 처리부, 기 번역문장이 저장된 기 번역문장 데이터베이스를 참조하여, 상기 추출된 요소와 상기 기 번역문장에 포함된 요소를 비교하고, 비교 결과에 근거하여 상기 제 1 언어 문장과 상기 기 번역문장 간의 유사도를 계산하는 유사도 계산부, 상기 계산된 유사도에 따라 상기 기 번역문장 데이터베이스를 참조하여 상기 제 1 언어 문장을 제 2 언어 문장으로 번역하는 문장 번역부 및 상기 번역된 제 2 언어 문장에 대응하는 음성 데이터를 검출하고, 검출된 음성 데이트를 합성하여, 상기 제 2 언어 문장에 대응하는 아날로그 형태의 음성 신호를 출력하는 음성 합성부를 포함한다.
-
公开(公告)号:KR101373053B1
公开(公告)日:2014-03-11
申请号:KR1020100064857
申请日:2010-07-06
Applicant: 한국전자통신연구원
CPC classification number: G06F17/289 , G10L15/26 , G10L25/78
Abstract: 본 발명은 문장 번역 장치 및 그 방법에 관한 것으로, 제1 언어의 음성에 대한 음성 인식 결과에 근거하여 제1 언어의 문장을 생성하는 음성 인식부, 제1 언어의 문장으로부터 형태소 품사를 태깅하는 형태소 품사 태깅부, 제1 언어의 음성으로부터 퍼즈(pause) 정보를 추출하는 퍼즈 추출부, 및 형태소 품사 태깅부에 의해 태깅된 형태소 품사 정보와 퍼즈 추출부에 의해 추출된 퍼즈 정보에 근거하여 제1 언어의 문장에 대해 문장 분리하는 문장 분리부를 포함한다. 본 발명에 따르면, 문장 번역을 위해 문장을 분리하는데 있어서 형태소 정보뿐만 아니라 음성에 대한 퍼즈(pause) 정보를 활용함으로써 보다 정확한 문장 분리가 가능한 이점이 있다.
-
公开(公告)号:KR1020120004151A
公开(公告)日:2012-01-12
申请号:KR1020100064857
申请日:2010-07-06
Applicant: 한국전자통신연구원
CPC classification number: G06F17/289 , G10L15/26 , G10L25/78
Abstract: PURPOSE: A sentence translating device and a method thereof are provided to use morpheme information and pause information about a voice, thereby accurately separating a sentence. CONSTITUTION: A voice recognizing unit(20) generates a sentence of a first language based on a voice recognition result about a voice of the first language. A morpheme part-of-speech tagger(40) tags a morpheme part-of-speech from a sentence of the first language. A pause extracting unit(30) extracts pause information from the voice of the first language. A sentence separating unit(50) applies pause information whose length is longer than a threshold value when the sentence of the first language is separated.
Abstract translation: 目的:提供句子翻译装置及其方法,以使用语素信息和暂停关于语音的信息,从而准确地分离句子。 构成:语音识别单元(20)基于关于第一语言的语音的语音识别结果生成第一语言的句子。 词素标注器(40)的语素从第一语言的句子中标注语素部分。 暂停提取单元(30)从第一语言的语音中提取暂停信息。 当分离第一语言的句子时,句子分离单元(50)应用长度大于阈值的暂停信息。
-
公开(公告)号:KR101092356B1
公开(公告)日:2011-12-09
申请号:KR1020080131220
申请日:2008-12-22
Applicant: 한국전자통신연구원
Abstract: 본발명은상호정보를이용한형태소품사태깅기술에관한것으로, 텍스트코퍼스와그 텍스트에대한형태소품사태깅된 DB를이용하여형태소간에순서정보를가진상호정보를구축하고, 입력문장에대해형태소해석을한 후, 그결과인형태소리스트들에대해형태소간의상호정보를계산하고, 그결과를기존의형태소품사태깅방법, 즉통계기반태깅방법과조합하여최적의품사태깅결과를출력할수 있도록하는것을특징으로한다. 본발명에의하면, 형태소품사태깅된 DB를이용하여형태소간에순서정보를가진상호정보를구축하고, 입력문장에대해형태소해석리스트에기 구축된상호정보를계산하고, 기존의형태소품사태깅방법과조합함으로써, 형태소품사태깅의정확도를높일수 있다.
-
公开(公告)号:KR101092352B1
公开(公告)日:2011-12-09
申请号:KR1020090021205
申请日:2009-03-12
Applicant: 한국전자통신연구원
Abstract: 본발명은문장코퍼스에대한영역자동분류방법및 장치에관한것으로, 음성언어정보처리를위해구축된대량의문장코퍼스에대하여문장단위로엔그램에기반하여세부영역으로자동분류하며, 문장을구성하는어절묶음을기반으로엔그램분석을수행함으로써, 문장코퍼스를좀 더세분화된영역으로자동분류하는모델을제공하며, 특정분야의문장코퍼스를세부영역으로분류하는데그치지않고, 인터넷에서수집가능한문장을대상으로필요한영역의문장을확보할수 있는이점이있다.
-
公开(公告)号:KR101025814B1
公开(公告)日:2011-04-04
申请号:KR1020080127710
申请日:2008-12-16
Applicant: 한국전자통신연구원
Abstract: 본 발명은 운율 모델을 이용한 형태소 품사 태깅 방법 및 그 장치에 관한 것으로, 음성인식의 결과 또는 전사한 텍스트문장의 형태소를 해석하고, 해석이 모호한 부분에 대해 음성 DB를 기반으로 기 구축된 형태소 품사 시퀀스별 운율 모델과 입력음성의 운율 모델을 비교하여, 입력음성의 운율 모델에 대한 최적의 형태소 품사 시퀀스를 찾고, 그 찾은 결과를 형태소 품사 태깅 방법과 조합시켜 형태소 품사를 태깅함으로써, 형태소 품사 태깅의 정확도를 극대화시킬 수 있다. 또한, 본 발명은 운율 모델을 적용하여 형태소 품사를 태깅함으로써, 화자의 발성 의도를 파악할 수 있다.
형태소, 운율 모델, 품사, 태깅-
公开(公告)号:KR1020100138520A
公开(公告)日:2010-12-31
申请号:KR1020090057093
申请日:2009-06-25
Applicant: 한국전자통신연구원
IPC: G10L15/197 , G10L15/14 , G10L15/06
Abstract: PURPOSE: A speech recognition apparatus and a method thereof are provided to reduce error of remote speech recognition. CONSTITUTION: A syntax analyzing unit(23) analyzes syntax based on a morpheme word class to generate a hierarchical structure. A hierarchical word list generating unit(24) generates a word list by a hierarchy of a recognition word using the hierarchical structure. A hierarchical n-gram applying unit(25) generates a hierarchical n-gram score of the word list by a hierarchy. A calculation unit(27) adds the hierarchical n-gram score to sound and language model probability to generate a speech recognition score of the recognition word.
Abstract translation: 目的:提供语音识别装置及其方法,以减少远程语音识别的误差。 构成:语法分析单元(23)基于语素词类分析语法以生成层次结构。 分级词列表生成单元(24)使用层次结构通过识别词的层次来生成单词列表。 分层的n-gram应用单元(25)通过层级产生单词列表的分层n-gram分数。 计算单元(27)将分级n-gram分数与声音和语言模型概率相加,以产生识别词的语音识别分数。
-
公开(公告)号:KR1020100072730A
公开(公告)日:2010-07-01
申请号:KR1020080131220
申请日:2008-12-22
Applicant: 한국전자통신연구원
CPC classification number: G06F17/2715 , G06F17/18 , G06F17/2755 , G06F17/289
Abstract: PURPOSE: A device and a method for tagging morpheme part-of-speech by using mutual information are provided to construct mutual information having inter-morpheme order information and calculates mutual information about inputted sentence and combine the mutual information with statistics-based on part-of-speech tagging method, thereby improving accuracy of morpheme part-of-speech tagging. CONSTITUTION: A mutual information construction unit(104) construct mutual information having order information between morphemes. A morpheme analyzing unit(110) outputs list of analyzable morphemes in inputted sentence. A mutual information calculator(112) obtains inter-morpheme mutual information about the list. A n-gram calculation unit calculates part-of-speech transition probability value about the list. A part-of-speech tagging unit selects morpheme analysis result.
Abstract translation: 目的:提供一种通过使用互信息来标注语素部分语音的设备和方法,以构建具有语素间信息的互信息,并计算有关输入句子的相互信息,并将互信息与统计信息相结合, 语音标注方法,从而提高语素词性标签的准确性。 构成:互信息构建单元(104)构建具有语素之间的订单信息的互信息。 语素分析单元(110)输出输入句子中的可分析语素列表。 互信息计算器(112)获得关于列表的语素间相互信息。 n-gram计算单元计算关于列表的部分语音转换概率值。 词性标签单元选择语素分析结果。
-
公开(公告)号:KR1020080028655A
公开(公告)日:2008-04-01
申请号:KR1020060094220
申请日:2006-09-27
Applicant: 한국전자통신연구원
IPC: G06F17/27
CPC classification number: G06F17/218 , G06F17/2735 , G06F17/2755 , G06F17/2775
Abstract: A method and a device for tagging part-of-speech are provided to tag the part-of-speech correctly at high speed by reducing calculation quantity and error probability, as a morpheme of each word is analyzed when the part-of-speech is tagged, and a morpheme connection error in the word and between the words is reduced in a morpheme analysis result. A data storing part(130,140,150,160,180,190) stores a word preprocessing dictionary(131), a morpheme dictionary(141), part-of-speech connection information(151), an intra-word morpheme connection error list(161), part-of-speech trigram information(181), and a between-word morpheme connection error list(191). A morpheme analyzer(120) analyzes a morpheme by dividing the inputted sentence into words and checking whether the word is found in the word preprocessing dictionary, checks whether the morphemes can be connected by using part-of-speech connection information, and removes a morpheme connection error by using the intra-word morpheme connection error list. A part-of-speech tagger(170) selects the optimal morpheme analysis result, tags the part-of-speech of the optimal morpheme analysis result by using the part-of-speech trigram information, and removes an error from a part-of-speech tagging result by using the morpheme connection error list.
Abstract translation: 提供一种用于标注语音部分的方法和装置,通过减少计算量和误差概率,通过减少每个单词的语素来高分辨率地标记语音部分,当词性为 在语素分析结果中,词和词之间的语素连接错误被减少。 数据存储部分(130,140,150,160,180,190)存储词预处理词典(131),词素词典(141),语音间连接信息(151),词内语素连接错误列表(161) 语音三角形信息(181)和字词之间语素连接错误列表(191)。 语素分析器(120)通过将输入的句子划分为单词并检查在单词预处理字典中是否找到该单词来分析语素,通过使用词性连接信息检查语素是否可以连接,并且去除语素 通过使用词内语素连接错误列表来连接错误。 词性标签器(170)选择最佳语素分析结果,通过使用词性三角形信息来标记最佳语素分析结果的词性,并从一部分 通过使用语素连接错误列表进行语音标记结果。
-
-
-
-
-
-
-
-
-