-
公开(公告)号:KR1020100067727A
公开(公告)日:2010-06-22
申请号:KR1020080126244
申请日:2008-12-12
Applicant: 한국전자통신연구원
Abstract: PURPOSE: A voice recognition unit and a method thereof of a multiple search base for performing a multi-search about the input speech signal of the multiple search base are provided to improve voice recognition performance about the voice signal by using FSN(Finite State Network) mode and N-gram mode. CONSTITUTION: A speech feature extracting block(102) extracts feature data about the inputted voice signal. A language model database(108) stores the FSN language model and N-gram language model. A multi-search block(104) is parallel performed the first voice search and the second voice search. The multiple search block is created in the integration search network. The multiple search block outputs the voice recognition result according to the third voice search.
Abstract translation: 目的:提供一种用于执行关于多个搜索库的输入语音信号的多次搜索的多重搜索基的语音识别单元及其方法,以通过使用FSN(有限状态网络)来改善关于语音信号的语音识别性能, 模式和N-gram模式。 构成:语音特征提取块(102)提取关于输入的语音信号的特征数据。 语言模型数据库(108)存储FSN语言模型和N-gram语言模型。 多搜索块(104)并行执行第一语音搜索和第二语音搜索。 多个搜索块在集成搜索网络中创建。 多重搜索块根据第三语音搜索输出语音识别结果。
-
公开(公告)号:KR100908444B1
公开(公告)日:2009-07-21
申请号:KR1020070070733
申请日:2007-07-13
Applicant: 한국전자통신연구원
IPC: G10L15/14 , G10L15/187 , G10L15/04 , G10L15/06
Abstract: 본 발명은 음소 인식 기반의 탐색공간 제한을 이용한 연속음성인식 장치 및 방법에 관한 것으로, 음소 인식 결과를 기반으로 단어의 경계 부분에서 천이될 연결 단어를 제한하는 방식으로 탐색공간을 1차적으로 줄이는 한편, 천이될 연결 단어가 음소 인식 결과와 얼마나 유사한지를 음소 코드를 통해 빠르게 계산하여 유사도가 소정 기준값 이상인 연결 단어에 대해서만 단어 천이를 수행하여 탐색공간을 2차적으로 줄여 음성인식을 수행함으로써, 다양한 음성인식 서비스에 있어서 음성인식 속도와 성능을 개선할 수 있는 것을 특징으로 한다.
음소 인식, 단어인식, 음성 인식Abstract translation: 提供了基于音素识别的搜索空间限制的连续语音识别装置及其方法,以通过在主要语音识别阶段中执行音素识别来提高语音识别速度和性能,将连接词限制为 基于二级语音识别阶段中的音素识别结果在单词的边界部分中发送,减小搜索空间并执行语音识别。 语音特征提取单元(110)从输入的语音信号中提取特征向量。 音素识别单元(120)基于语音信号的特征矢量识别音素。 基于音素的语音识别单元(150)基于音素识别结果来配置其中搜索空间被限制的连接词搜索网络,并且基于连接词搜索网络来执行语音识别。
-
公开(公告)号:KR1020090062684A
公开(公告)日:2009-06-17
申请号:KR1020070130077
申请日:2007-12-13
Applicant: 한국전자통신연구원
Abstract: A multi-step speech recognition apparatus and a multi-step speech recognition method at the multi-step speech recognition apparatus are provided to determine a final recognition word string by reflecting the word string and reliability of optimal N phoneme series, obtained through phoneme recognition performance, to a word string recognition result, thereby improving the performance of voice recognition. A voice feature extracting unit(110) extracts voice feature data from an inputted voice signal. A phoneme recognition unit(120) determines optimal N phoneme series which are most close to the extracted voice feature data. A word recognition unit(130) acquires a word string for each of the optimal N phoneme series. By utilizing an accumulation likelihood value, a reliability extracting unit(140) extracts reliability for each of the optimal N phoneme series. A final recognition result determining unit(150) determines a final recognition word string based on the each extracted reliability and the acquired N word strings.
Abstract translation: 提供了一种多步语音识别装置和多步语音识别装置,通过反映通过音素识别性能获得的最佳N个音素系列的字串和可靠性来确定最终识别字串 ,以字符串识别结果,从而提高语音识别的性能。 语音特征提取单元(110)从输入的语音信号中提取语音特征数据。 音素识别单元(120)确定最接近所提取的语音特征数据的最佳N个音素系列。 字识别单元(130)获取每个最佳N个音素系列的字串。 通过利用累积似然值,可靠性提取单元(140)提取每个最优N个音素系列的可靠性。 最终识别结果确定单元(150)基于每个提取的可靠性和所获取的N个字串来确定最终的识别字串。
-
公开(公告)号:KR100327109B1
公开(公告)日:2002-03-07
申请号:KR1019990061893
申请日:1999-12-24
Applicant: 한국전자통신연구원
IPC: G06F17/26
Abstract: 본발명은, 음절단위조건확률을이용한한국어자동띄어쓰기방법과, 이를실현시키기위한프로그램을기록한컴퓨터로읽을수 있는기록매체에관한것으로, 어휘지식또는발견적교수법(heuristic)을사용하지않고통계적인방법을사용하여띄어쓰기가일부되어있는문장또는띄어쓰기가전혀되어있지않은문장에대해서띄어쓰기를처리할수 있는음절단위조건확률을이용한한국어자동띄어쓰기방법과, 이를실현시키기위한프로그램을기록한컴퓨터로읽을수 있는기록매체를제공하며, 표준문장코퍼스로부터통계처리를통하여음절간천이확률을설정하는제 1 단계; 상기설정된확률에의거하여띄어쓰기처리대상문장에포함된음절열에대하여첫 번째음절부터시작하여, 각음절사이에띄어쓰기를하는경우와안하는경우를나누어모든경우의조합에의하여누적로그확률을순차적으로계산하는제 2 단계; 및상기제 2 단계의계산된결과에의하여, 최대누적로그확률에해당하는경로를선택하여백 포인터를이용하여입력된음절의띄어쓰기최적패턴을탐색하여출력스트링을획득하는제 3 단계를수행한다.
-
公开(公告)号:KR1019970022961A
公开(公告)日:1997-05-30
申请号:KR1019950035697
申请日:1995-10-16
Applicant: 한국전자통신연구원
IPC: G10L15/28
Abstract: 본 발명은 사람의 연속 발성중 대어휘 단어를 인식하는 연속 발성 단어 인식기에 관한 것으로, 사람의 발성중 발성 속도에 크게 영향을 받지않는 천이 구간에서 음성 특징으로 추출하여 천이 음소를 인식하고, 이를 바탕으로 대어휘 단어를 인식하는 연속 발성 단어 인식기를 제공하기 위하여, 외부로부터 음성 신호를 입력받아 음성 특징으로 추출하여 특징 추출 수단(11); 상기 특징 추출 수단(11)으로부터 특징 벡터를 입력받아 음성 특징이 크게 변화한 구간을 찾아내어 천이 구간 정보를 출력하는 천이 구간 검출 수단(13); 상기 특징 추출 수단(11)으로부터 특징 벡터를 입력받고, 상기 천이 구간정보를 입력받아 음소 천이를 인식하여 음소 천이 백터를 출력하는 음소 천이 인식 수단(12); 및 상기 음소 천이 인식 수단(12)으로부터 음소 천이 벡터를 입력받아 단어와 매칭하여 분류하는 단어 분류 수단(14)을 구비하여 높은 인식 성능을 안정적으로 얻을 수 있는 효과가 있다.
-
公开(公告)号:KR1020110038448A
公开(公告)日:2011-04-14
申请号:KR1020090095741
申请日:2009-10-08
Applicant: 한국전자통신연구원
CPC classification number: G06F17/2854
Abstract: PURPOSE: An automatic interpretation terminal, a service, a system and method for servicing automatic interpretation are provided to supply rapid and exact interpretation service by directly performing interpretation and relay interpretation by utilizing a plurality of interpretation supporters and providing an interpretation result to a terminal of a user. CONSTITUTION: A communication unit(300) receives interpretation request from a user. The communication unit transmits an interpretation result according to the interpretation request. A interpretation applicant information DB(306) stores a list information of the interpretation supporters capable of performing interpretation as a target language. A server control unit(304) searches interpretation supporter capable of interpreting the request target language.
Abstract translation: 目的:提供自动解释终端,服务,系统和方法来提供快速准确的口译服务,通过利用多个解释支持者直接进行解释和中继解释,并将解释结果提供给终端 一个用户 构成:通信单元(300)从用户接收解释请求。 通信单元根据解释请求发送解释结果。 解释申请者信息DB(306)存储能够进行解释的解释支持者的列表信息作为目标语言。 服务器控制单元(304)搜索能够解释请求目标语言的解释支持者。
-
公开(公告)号:KR1020100137873A
公开(公告)日:2010-12-31
申请号:KR1020090056120
申请日:2009-06-23
Applicant: 한국전자통신연구원
Abstract: PURPOSE: A speaker adaptation system and a method thereof are provided to utilize the cumulative variable for obtaining enough statistics for the non-instruction adaptation in voice recognitioin process without performing an adaptation training thereby enabling to gradual adaptation. CONSTITUTION: A characteristic detecting part(110) extracts an eigenvector from a voice signal. A sound model storage(120) stores an acoustic model consisting of a recursive tree. A conversion parameter class determiner(130) produces gaussian posteriori probability of a candidate state based on the eigenvector and the sound model and determines the cumulative variable and a conversion parameter class based on the gaussian posterior probability. A sound model updater(140) produces the conversion parameter based on the conversion parameter class and cumulative variable and renews the acoustic model.
Abstract translation: 目的:提供一种扬声器适应系统及其方法,以利用该累积变量来获得用于语音识别过程中的非指令适配的足够的统计量,而不进行适应训练,从而能够逐渐适应。 构成:特征检测部(110)从语音信号中提取特征向量。 声音模型存储(120)存储由递归树组成的声学模型。 转换参数类确定器(130)基于特征向量和声音模型产生候选状态的高斯后验概率,并且基于高斯后验概率确定累积变量和转换参数类。 声音模型更新器(140)基于转换参数类和累积变量产生转换参数,并更新声学模型。
-
公开(公告)号:KR1020080052268A
公开(公告)日:2008-06-11
申请号:KR1020070070733
申请日:2007-07-13
Applicant: 한국전자통신연구원
IPC: G10L15/14 , G10L15/187 , G10L15/04 , G10L15/06
Abstract: A continuous voice recognition apparatus using the limit of a search space on the basis of phoneme recognition and a method therefor are provided to improve a voice recognition speed and performance by performing the phoneme recognition in a primary voice recognition stage, limiting a connection word to be transmitted in a boundary part of a word on the basis of the phoneme recognition result in a secondary voice recognition stage, reducing the search space, and performing voice recognition. A voice feature extracting unit(110) extracts a feature vector from an inputted voice signal. A phoneme recognition unit(120) recognizes a phoneme on the basis of the feature vector of the voice signal. A phoneme-based voice recognition unit(150) configures a connection word search network in which a search space is limited on the basis of the phoneme recognized result, and performs voice recognition on the basis of the connection word search network.
Abstract translation: 提供一种使用基于音素识别的搜索空间限制的连续语音识别装置及其方法,以通过在主要语音识别级中执行音素识别来改善语音识别速度和性能,从而将连接词限制为 基于二次语音识别阶段中的音素识别结果,在单词的边界部分中发送,减少搜索空间,并执行语音识别。 语音特征提取单元(110)从输入的语音信号中提取特征向量。 音素识别单元(120)基于语音信号的特征向量来识别音素。 基于音素的语音识别单元(150)根据音素识别结果配置其中搜索空间被限制的连接词搜索网络,并且基于连接词搜索网络执行语音识别。
-
公开(公告)号:KR1020010064247A
公开(公告)日:2001-07-09
申请号:KR1019990062397
申请日:1999-12-27
Applicant: 한국전자통신연구원
IPC: G06F17/20
Abstract: PURPOSE: A method for using multi level voice recognition unit is provided to obtain a language model from a statistics value and to recognize a language model using various-level recognition units by searching all connection relations of recognition units of various levels. CONSTITUTION: In a language model construction method using an n-gram for designating a word being displayed after a specific word, a language model is constructed by considering all connection relations between language units of various levels after inputted sentence is divided into language units of various levels. In addition, in a voice recognition searching method using a n-gram for designating a word being displayed after a specific word, a language model is constructed and stored by considering all connection relations between language units of various levels after inputted sentence is divided into language units of various levels. A matched sentence is searched out of the language model stored in the above stage by considering all connection relations between language units of various levels after the inputted sentence is divided into language units of various levels.
Abstract translation: 目的:提供一种使用多级语音识别单元的方法,从统计值获取语言模型,并通过搜索各级识别单元的所有连接关系,通过各级识别单元识别语言模型。 构成:在使用n-gram指定在特定单词之后显示的单词的语言模型构建方法中,通过考虑所有语言单元之间的所有连接关系,将输入的句子分为各种语言单元之后,构建语言模型 水平。 此外,在使用n-gram指定在特定单词之后显示的单词的语音识别搜索方法中,通过考虑所输入的句子之间的各种语言单元之间的所有连接关系被分成语言来构建和存储语言模型 各级单位 通过考虑将输入的句子分成各种语言单位之后的各级语言单元之间的所有连接关系,从存储在上述阶段的语言模型中搜索匹配的句子。
-
公开(公告)号:KR100236962B1
公开(公告)日:2000-01-15
申请号:KR1019970034598
申请日:1997-07-23
Applicant: 한국전자통신연구원
Abstract: 1. 청구 범위에 기재된 발명이 속한 기술분야
본 발명은 음소별 화자 종속 변이음(allophone) 모델링 방법에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은 각 음소별로 화자 특성을 고려할 수 있는 음성 단위 선정 방법으로서 문맥 및 화자를 동시에 모두 고려한 음소별 화자 종속 변이음(allophone) 모델링 방법을 제공하고자 함.
3. 발명의 해결방법의 요지
본 발명은, 음성 인식기에 적용되는 음성 모델링 방법에 있어서, 각 음소별 음성 데이터의 특징 벡터열을 읽어, 트랜스크립션과 발음 사전을 이용하여 문맥 정보를 얻은 후에 각 자료의 화자를 식별하는 제 1 단계; 주어진 데이터를 문맥과 화자에 따라 두 개의 그룹으로 나눈 후에 나누어진 그룹의 적합성을 측정하는 과정을 반복하는 제 2 단계; 및 나뉘어진 그룹의 샘플의 갯수가 소정의 값 이상인 그룹이 존재하면 두 개의 그룹으로 나누는 과정을 계속하고, 그러한 그룹이 더 이상 존재하지 않으면 종료하는 제 3 단계를 포함한다.
4. 발명의 중요한 용도
본 발명은 음성 인식기에 이용됨.
-
-
-
-
-
-
-
-
-