-
公开(公告)号:KR100617318B1
公开(公告)日:2006-08-30
申请号:KR1020050015006
申请日:2005-02-23
Applicant: 한국전자통신연구원
Abstract: 본 발명에 의한 2단계 구문분석을 통한 자동 번역 장치 및 그 방법은 입력문에 대해 형태소를 분석하는 형태소 분석부; 상기 각 형태소에 대해 품사 후보를 결정하는 태깅부; 태깅된 상기 입력문에 대하여 동사구를 중심으로 구문분석을 수행한 후 상기 입력문 전체문장에 대한 구문분석을 수행하는 구문분석부; 및 상기 구문분석 결과 생성되는 구문 트리를 기초로 하여 상기 입력문의 번역문을 생성하는 변환생성부;를 포함하는 것을 특징으로 하며, 구문분석 모호성중에서 태깅 모호성 및 명사구 청킹 모호성과 병렬 및 부착 모호성을 분리하여, 1단계에서 태깅 모호성 및 명사구 청킹 모호성을 해결하고, 2단계 병렬 및 부착 모호성을 해결함으로써 성능의 큰 저하 없이 분석 효율성을 올릴 수 있다.
자동번역, 구문분석, 문장분할, 기본 명사구, 동사구 분석-
公开(公告)号:KR1020060064443A
公开(公告)日:2006-06-13
申请号:KR1020050015006
申请日:2005-02-23
Applicant: 한국전자통신연구원
CPC classification number: G06F17/2809 , G06F17/2755 , G06F17/2775
Abstract: 본 발명에 의한 2단계 구문분석을 통한 자동 번역 장치 및 그 방법은 입력문에 대해 형태소를 분석하는 형태소 분석부; 상기 각 형태소에 대해 품사 후보를 결정하는 태깅부; 태깅된 상기 입력문에 대하여 동사구를 중심으로 구문분석을 수행한 후 상기 입력문 전체문장에 대한 구문분석을 수행하는 구문분석부; 및 상기 구문분석 결과 생성되는 구문 트리를 기초로 하여 상기 입력문의 번역문을 생성하는 변환생성부;를 포함하는 것을 특징으로 하며, 구문분석 모호성중에서 태깅 모호성 및 명사구 청킹 모호성과 병렬 및 부착 모호성을 분리하여, 1단계에서 태깅 모호성 및 명사구 청킹 모호성을 해결하고, 2단계 병렬 및 부착 모호성을 해결함으로써 성능의 큰 저하 없이 분석 효율성을 올릴 수 있다.
자동번역, 구문분석, 문장분할, 기본 명사구, 동사구 분석-
公开(公告)号:KR1020010063799A
公开(公告)日:2001-07-09
申请号:KR1019990061893
申请日:1999-12-24
Applicant: 한국전자통신연구원
IPC: G06F17/26
Abstract: PURPOSE: An automatic word spacing method of Korean using syllable unit condition probability is provided to process a word spacing method with respect to a sentence prepared based on partial spacing words and a sentence having no space by using a statistical method instead of a vocabulary knowledge or a heuristic. CONSTITUTION: A hypothesis for a spacing words optimum pattern search is set(400). The maximum accumulated log probability is calculated based on the set hypothesis(402). An output string is obtained by searching a spacing words optimum pattern of a syllable inputted using the maximum accumulated log probability and the back pointer(404). In the hypothesis process, a space is generated when a transient is generated as the same state, and a syllable is generated when a transient is generated as a different state. One hypothesis has the latest "n-1" number syllable, an accumulated log probability, and a back pointer. The back pointer is used for sensing the previous hypothesis extracting the current hypothesis, and stores a time, a status and a pointer of the previous hypothesis.
Abstract translation: 目的:提供韩语使用音节单位条件概率的自动字间距方法,用于处理基于部分间隔字准备的句子的字间距方法和使用统计方法而不是词汇知识的无空格句, 启发式 构成:设定间距字最优图案搜索的假设(400)。 基于设定的假设计算最大累积对数概率(402)。 通过搜索使用最大累积对数概率输入的音节的间隔字最优模式和后向指针(404)来获得输出字符串。 在假设过程中,当产生瞬态作为相同状态时产生空间,并且当产生瞬态作为不同状态时产生音节。 一个假设有最新的“n-1”个数字音节,累积的日志概率和一个后退指针。 后指针用于感测提取当前假设的先前假设,并存储上一假设的时间,状态和指针。
-
公开(公告)号:KR1020000033276A
公开(公告)日:2000-06-15
申请号:KR1019980050076
申请日:1998-11-21
Applicant: 한국전자통신연구원
IPC: G10L15/02
Abstract: PURPOSE: A frame compression method using representative characteristic column and an audio recognition method using the same are provided to reduce the number of frame without degradation of performance by obtaining a representative frame of similar frames after extracting a characteristic column from frames of constant time interval. CONSTITUTION: A frame compression method using representative characteristic column comprises steps of: dividing compression signal by prescribed time interval into a frame; extracting a characteristic column about the divided frame; obtaining the similarity between the extracted characteristic columns; obtaining a representative characteristic column of similar characteristic columns using the obtained similarity.
Abstract translation: 目的:提供使用代表性特征列的帧压缩方法和使用其的音频识别方法,以通过在从恒定时间间隔的帧中提取特征列之后获得类似帧的代表帧来减少帧数而不降低性能。 构成:使用代表性特征列的帧压缩方法包括以下步骤:将压缩信号按规定的时间间隔划分成一帧; 提取关于分割帧的特征列; 获得提取的特征列之间的相似性; 使用获得的相似度获得类似特征列的代表性特征列。
-
公开(公告)号:KR1019990047329A
公开(公告)日:1999-07-05
申请号:KR1019970065686
申请日:1997-12-03
Applicant: 한국전자통신연구원
IPC: G10L15/04
Abstract: 본 발명은 의사형태소를 이용한 음성 인식 단위의 설정 방법에 관한 것이다. 음성 인식에서는 사전에 등록되는 어휘가 음성 인식의 기본 작업 단위가 되며 인식 대상 어휘의 수가 음성 인식 작업의 난이도와 인식 성능을 결정하는 요소가 된다. 종래에는 어절, 음절 또는 음소 단위로 인식 단위를 설정하여 입력되는 음성을 인식하고 처리하였다. 그러나 어절을 인식 단위로 하여 음성을 인식할 경우 인식 대상이 되는 어휘의 수가 증가하여 확장성이 저하되고 음절이나 음소를 인식 단위로 할 경우에는 언어학적 특성이 사라져 후처리시에 언어 지식을 적용하기가 어려워지는 문제점이 있다. 또한 형태소를 인식 단위로 하는 방법이 있는데, 이 경우에도 어절을 형태로소 분리할 때 생략되거나 축약된 형태소가 재생되어 원래 어절의 소리값과 형태소로 분리된 소리값이 일치하지 않게 되는 문제점이 있다. 이러한 문제점을 해결하기 위하여 본 발명에서는 인식 단위 각각이 언어학적 특성과 주어진 어절의 소리값을 유지하면서 전체 인식 대상 어휘의 수를 감소시킬 수 있는 의사형태소를 도입하고 입력된 어절을 내용어와 기능어로 분리하여 음성을 인식하므로써 음성 인식 대상 어휘의 수를 적절한 수로 유지하게 되어 음성 인식 시스템의 작업 영역을 확장할 수 있는 의사형태소를 이용한 음성 인식 단위 설정 방법이 제시된다.
-
-
公开(公告)号:KR1020170108621A
公开(公告)日:2017-09-27
申请号:KR1020160032815
申请日:2016-03-18
Applicant: 한국전자통신연구원
Inventor: 권오욱
Abstract: 단일언어코퍼스를이용한통계및 학습기반번역장치가개시된다. 단일언어코퍼스를이용한통계및 학습기반번역장치는원시언어입력문장의문맥에가장적합한원시언어어순의목적언어단어나구를생성하는번역디코더부와, 상기번역디코더부에서생성한원시언어어순의목적언어단어와구의나열을목적언어어순과표현의번역문장으로생성하는단일언어학습번역부를포함한다. 따라서, 최적의번역결과를제공할수 있다.
Abstract translation: 公开了使用单一语言语料库的基于统计和学习的翻译设备。 使用单一语言语料中统计和基于学习的翻译系统是最合适的翻译解码器生成的母语目标语言那格浦尔,词序,在翻译解码器单元语言的源语言输入句子的上下文中创建的源语言语序的目的 以及单个语言学习翻译单元,用于生成单词和短语列表作为目标语言顺序和表达的翻译句子。 因此,可以提供最佳的翻译结果。
-
公开(公告)号:KR1020170086215A
公开(公告)日:2017-07-26
申请号:KR1020160005757
申请日:2016-01-18
Applicant: 한국전자통신연구원
Abstract: 본발명에따른대화지식추출서버는통신모듈, 대화지식정보를생성하기위한프로그램이저장된메모리및 상기프로그램을실행시키는프로세서를포함하되, 상기통신모듈을통해화자정보를포함하는제 1 대화말뭉치및 화자정보가포함되지않은제 2 대화말뭉치를입력받으면, 상기프로세서는상기프로그램을실행시킴에따라, 상기제 1 및제 2 대화말뭉치로부터벡터모델을추출하고, 상기제 1 대화말뭉치를전처리하여학습말뭉치를추출한뒤, 상기학습말뭉치로부터자질벡터를추출하고, 상기자질벡터를기계학습하여대화지식추출모델을생성하며, 상기대화지식추출모델에기초하여상기제 2 대화말뭉치로부터대화지식정보를추출하되, 상기자질벡터는화자정보, 발화시간정보, 발화상황정보, 발화의도정보, 감성정보, 대화유사도정보중 하나이상을포함한다.
Abstract translation: 但根据本发明的提取对话知识服务器包括用于通信模块的处理器,用于生成执行所存储的存储器和程序中,所述第一对话语料库和包括通过所述通信模块的扬声器信息的扬声器进行对话知识的程序 当输入第二个对话框语料库信息不包含的,所述处理器从所述第一mitje第二对话语料库根据锡金执行程序,和预调节第一对话语料库中提取学习语料库提取物,矢量模型 回,但是从学习语料库中提取质量向量,并且,通过学习机的品质矢量生成对话框知识提取模型,对话知识提取模型的基础上从所述第二对话语料库中提取会话的知识信息,其中,所述质量 矢量包括扬声器的信息,和时间信息发声,语音上下文,那么发声也信息,情感信息,对话的相似性信息中的至少一个。
-
公开(公告)号:KR101709187B1
公开(公告)日:2017-02-23
申请号:KR1020120128907
申请日:2012-11-14
Applicant: 한국전자통신연구원
IPC: G10L15/22 , G10L15/183 , G06F3/16 , H04M3/493
CPC classification number: G10L15/22 , G06F3/167 , G10L2015/225 , H04M3/4938
Abstract: 본발명은구축비용및 시간이많이드는대화지식의재활용이어려운기존의음성대화시스템과는달리, 계층적구조를가지는태스크단위의대화지식을구축하여패키지화하여이들의재활용성을높이고대화서비스설계가편리하도록태스크단위로구분하여이들간의관계를대화계획방식으로대화지식을구축하고처리할수 있는계층적대화태스크라이브러리를이용한이중대화관리기반음성대화시스템및 방법에관한것이다.
Abstract translation: 本发明涉及一种基于双对话管理的口语对话系统和方法,其中使用层次对话任务库,其可以通过基于具有层次结构的任务单元构建和打包对话知识来增加对话知识的再利用,并且可以构建和 使用关于它们之间的关系的对话计划方案处理对话知识,通过对基于任务单元的对话知识进行分类,使对话服务的设计方便,这与现有的口语对话系统不同,其中难以重用对话知识,因为 需要大量的施工成本和时间。
-
公开(公告)号:KR1020160008949A
公开(公告)日:2016-01-25
申请号:KR1020150008800
申请日:2015-01-19
Applicant: 한국전자통신연구원
IPC: G06Q50/20
CPC classification number: G06Q50/20
Abstract: 음성대화기반의외국어학습방법및 이를위한장치가개시된다. 본발명에따른음성대화기반의외국어학습장치는학습자가발화한문장을인식하여텍스트로변환하는음성인식부와; 텍스트로변환된발화문장에대한발화의도를추정하고, 상기발화문장을구성하는각 어휘에대한언어학적구조분석을수행하는언어분석및 이해부와; 및추정된발화의도에기초하여상기발화문장에대한응답을생성하고, 언어학적구조분석결과에기초하여상기발화문장에포함되어있는오류를인식하고, 상기오류에대한교정피드백을제공하는대화처리부를포함한다.
Abstract translation: 公开了一种基于口语对话的外语学习方法及其装置。 根据本发明的基于口语对话的外语学习装置包括:语音识别单元,用于识别学习者所讲的句子并将句子转换为文本; 一种语言分析和理解单元,用于估计关于口头句子的语言意图,其被转换成文本并且对于形成口语句子的每个单词进行语言结构分析; 以及对话处理单元,基于所估计的语音意图产生口语句子的答案,基于语言结构分析结果识别包含在口语句中的错误,并为错误提供校正反馈。
-
-
-
-
-
-
-
-
-