음성 인식 장치 및 그 방법
    41.
    发明公开
    음성 인식 장치 및 그 방법 有权
    语音识别装置及其方法

    公开(公告)号:KR1020100138520A

    公开(公告)日:2010-12-31

    申请号:KR1020090057093

    申请日:2009-06-25

    Abstract: PURPOSE: A speech recognition apparatus and a method thereof are provided to reduce error of remote speech recognition. CONSTITUTION: A syntax analyzing unit(23) analyzes syntax based on a morpheme word class to generate a hierarchical structure. A hierarchical word list generating unit(24) generates a word list by a hierarchy of a recognition word using the hierarchical structure. A hierarchical n-gram applying unit(25) generates a hierarchical n-gram score of the word list by a hierarchy. A calculation unit(27) adds the hierarchical n-gram score to sound and language model probability to generate a speech recognition score of the recognition word.

    Abstract translation: 目的:提供语音识别装置及其方法,以减少远程语音识别的误差。 构成:语法分析单元(23)基于语素词类分析语法以生成层次结构。 分级词列表生成单元(24)使用层次结构通过识别词的层次来生成单词列表。 分层的n-gram应用单元(25)通过层级产生单词列表的分层n-gram分数。 计算单元(27)将分级n-gram分数与声音和语言模型概率相加,以产生识别词的语音识别分数。

    가중 유한 상태 변환기에서의 널 심벌 천이 제거 방법
    42.
    发明公开
    가중 유한 상태 변환기에서의 널 심벌 천이 제거 방법 失效
    在加权有限状态传输器中提供空符号转换排除的方法

    公开(公告)号:KR1020100073170A

    公开(公告)日:2010-07-01

    申请号:KR1020080131764

    申请日:2008-12-22

    Abstract: PURPOSE: A null symbol transition removal method in weighting finite state transducer is provided to remove all ε input transitions except a loop formed by ε input transitions, thereby minimizing the size of the weighting finite state transducer according to a form of input transitions of the whole weighted finite state transducer. CONSTITUTION: An input transition search unit(100) searches null symbol transition while searching the whole weighted finite state transducer, for example searching ε input transition. An input transition determination unit(102) determines type of the ε input transition. An input transition removing unit(104) removes the ε input transition according to type of the determined ε input transition. If an input symbol is null, forward direction processing suitable for node type is performed. If the input symbol is not null, the next transition is performed.

    Abstract translation: 目的:提供加权有限状态传感器中的零符号跃迁去除方法,以除去除了ε输入跃迁形成的环之外的所有ε输入跃迁,从而根据整体输入转换的形式最小化加权有限状态换能器的大小 加权有限状态传感器。 构成:输入转换搜索单元(100)在搜索整个加权有限状态换能器时搜索零符号转换,例如搜索ε输入转换。 输入转换确定单元(102)确定ε输入转换的类型。 输入转换去除单元(104)根据确定的ε输入转换的类型去除ε输入转变。 如果输入符号为空,则执行适合于节点类型的正向处理。 如果输入符号不为空,则执行下一个转换。

    상호 정보를 이용한 형태소 품사 태깅 장치 및 방법
    43.
    发明公开
    상호 정보를 이용한 형태소 품사 태깅 장치 및 방법 失效
    通过使用相互信息标记语音部分的装置和方法

    公开(公告)号:KR1020100072730A

    公开(公告)日:2010-07-01

    申请号:KR1020080131220

    申请日:2008-12-22

    CPC classification number: G06F17/2715 G06F17/18 G06F17/2755 G06F17/289

    Abstract: PURPOSE: A device and a method for tagging morpheme part-of-speech by using mutual information are provided to construct mutual information having inter-morpheme order information and calculates mutual information about inputted sentence and combine the mutual information with statistics-based on part-of-speech tagging method, thereby improving accuracy of morpheme part-of-speech tagging. CONSTITUTION: A mutual information construction unit(104) construct mutual information having order information between morphemes. A morpheme analyzing unit(110) outputs list of analyzable morphemes in inputted sentence. A mutual information calculator(112) obtains inter-morpheme mutual information about the list. A n-gram calculation unit calculates part-of-speech transition probability value about the list. A part-of-speech tagging unit selects morpheme analysis result.

    Abstract translation: 目的:提供一种通过使用互信息来标注语素部分语音的设备和方法,以构建具有语素间信息的互信息,并计算有关输入句子的相互信息,并将互信息与统计信息相结合, 语音标注方法,从而提高语素词性标签的准确性。 构成:互信息构建单元(104)构建具有语素之间的订单信息的互信息。 语素分析单元(110)输出输入句子中的可分析语素列表。 互信息计算器(112)获得关于列表的语素间相互信息。 n-gram计算单元计算关于列表的部分语音转换概率值。 词性标签单元选择语素分析结果。

    음성 인식 방법 및 장치
    44.
    发明授权
    음성 인식 방법 및 장치 有权
    用于识别语音的方法和装置

    公开(公告)号:KR100925479B1

    公开(公告)日:2009-11-06

    申请号:KR1020070095540

    申请日:2007-09-19

    CPC classification number: G10L15/187 G10L2015/025

    Abstract: 본 발명은 음성 인식 방법 및 장치에 관한 것으로, 음소 인식된 음소열에 대한 신뢰도를 계산하고 이를 이용하여 음성 인식 성능을 향상시키기 위한 방법 및 장치를 제공한다. 이를 위하여, 본 발명에 따른 음성 인식 방법은, 음성으로 입력된 문자열에 포함된 음소 간의 경계를 결정함으로써 각 음소 구간을 검출하는 단계; 상기 검출된 각 음소 구간이 나타내는 음소가 미리 정의된 음소 모델에 속하는 각 음소일 확률에 따른 신뢰도를 계산하는 단계; 상기 계산된 신뢰도 및 미리 훈련하여 저장된 음소 인식 확률 분포를 기반으로 상기 문자열에 대한 음소 정렬 비용을 계산하는 단계; 및 상기 계산된 음소 정렬 비용을 기반으로 음소 정렬을 수행함으로써 상기 입력된 문자열을 음성 인식하는 단계를 포함함으로써, 음소 인식된 음소열에 대한 신뢰도를 계산하고 이를 이용하여 음성 인식 성능을 향상시킬 수 있는 이점이 있다.
    음성 인식, 유사도, 확률, 신뢰도

    입술움직임 영상 판별 방법 및 그 장치
    45.
    发明授权
    입술움직임 영상 판별 방법 및 그 장치 失效
    用于辨别唇部运动图像的方法和装置

    公开(公告)号:KR100924795B1

    公开(公告)日:2009-11-03

    申请号:KR1020070133391

    申请日:2007-12-18

    Abstract: 본 발명은 음성인식을 위해 수신되는 비디오를 분석하여 입술움직임이 있는지의 여부를 확인할 때, 다양한 움직임 영상을 대상으로 입술움직임 영상과 그 이외의 영상을 분류하는 입술움직임 영상 판별 방법 및 그 장치에 관한 것으로, 본 발명은 온라인 입술움직임 영상 판별 방법에 있어서, 촬영수단으로부터 수신되는 움직임영상프레임을 분석하여 입술움직임 영상에 대한 최종후보를 추출하는 제 1 단계; 및 영상추출수단으로부터 수신되는 상기 최종후보를 입술움직임 변별력 특징을 기준으로 입술움직임 영역과 여타요소 움직임 영역으로 온라인 상에서 레이블링하고, 최종후보 중에서 입술움직임 영역 및 여타요소 움직임 영역으로 분류되지 않은 최종후보에 대한 입술움직임 영상 여부를 SVM 영역분류구분선을 근거로 판별하는 제 2 단계;를 포함하는 것을 특징으로 한다.
    SVM 패턴분류, 입술움직임 영상 판별

    음성 인식 방법 및 장치
    47.
    发明公开
    음성 인식 방법 및 장치 有权
    用于识别语音的方法和装置

    公开(公告)号:KR1020090030166A

    公开(公告)日:2009-03-24

    申请号:KR1020070095540

    申请日:2007-09-19

    CPC classification number: G10L15/187 G10L2015/025

    Abstract: A voice recognition method and an apparatus thereof are provided to calculate the reliability on a grapheme string of recognized grapheme, and improve the voice recognition performance by using the reliability. A phoneme interval detecting unit(404) analyzes voice feature data outputted from a voice feature extracting unit(402), and then determines the boundary between phonemes to detect a phoneme interval. A reliability decision unit(406) compares the pattern of the detected phoneme intervals with phonemes belonging to a pre-defined phoneme model(416) to calculate the similarity. A reliability-based phoneme error model(418) stores the phoneme recognition probability distribution which is obtained by training whether an inputted voice phoneme is recognized as any kind of phoneme, in advance.

    Abstract translation: 提供语音识别方法及其装置,以计算识别的图形的字母串的可靠性,并通过使用可靠性来提高语音识别性能。 音素间隔检测单元(404)分析从语音特征提取单元(402)输出的语音特征数据,然后确定音素之间的边界以检测音素间隔。 可靠性决定单元406将所检测的音素间隔的模式与属于预先定义的音素模型(416)的音素进行比较,以计算相似度。 基于可靠性的音素误差模型(418)存储通过训练将输入的语音音素是否被识别为任何种类的音素而获得的音素识别概率分布。

    핵심어 인식 기반의 탐색 네트워크 제한을 이용한연속음성인식 장치 및 방법
    48.
    发明授权
    핵심어 인식 기반의 탐색 네트워크 제한을 이용한연속음성인식 장치 및 방법 失效
    基于关键字识别的搜索网络限制识别连续语音的方法和设备

    公开(公告)号:KR100835985B1

    公开(公告)日:2008-06-09

    申请号:KR1020060124206

    申请日:2006-12-08

    Abstract: An apparatus and a method for recognizing continuous speech using search network limitation based on keyword recognition are provided to recognize keywords capable of limiting the size of a keyword search network, and perform speech recognition through keyword-associated search networks, thereby improving speech recognition speed and performance. An apparatus for recognizing continuous speech comprises a speech property extractor(110), a keyword recognizer(120), and a keyword-based speech recognizer(140). The speech property extractor extracts a specific vector from an input speech signal. The keyword recognizer recognizes and extracts keywords through a keyword search network(130) configured by centering on the keyword capable of limiting the size of the keyword search network based on the specific vector of the speech signal. The keyword-based speech recognizer configures n keyword-associated search networks(150) with a limited search space on the basis of the extracted keywords, and performs the speech recognition based on the keywords through the n keyword-associated search networks. The keyword recognizer extracts non-keywords from the specific vector of the speech signal through a filler model(160) to extract only keywords, and recognizes and extracts the keywords capable of limiting the size of the keyword search network out of the keywords extracted through the keyword search network.

    Abstract translation: 提供了一种基于关键词识别的搜索网络限制识别连续语音的装置和方法,以识别能够限制关键词搜索网络的大小的关键词,并通过关键字关联搜索网络进行语音识别,从而提高语音识别速度, 性能。 用于识别连续语音的装置包括语音特征提取器(110),关键字识别器(120)和基于关键字的语音识别器(140)。 语音特征提取器从输入语音信号中提取特定向量。 关键字识别器通过关键词搜索网络(130)来识别和提取关键词,该关键字搜索网络(130)基于能够基于语音信号的特定向量来限制关键字搜索网络的大小的关键词来配置。 基于关键字的语音识别器基于所提取的关键词来配置具有有限搜索空间的n个关键字关联的搜索网络(150),并且通过n个关键字关联的搜索网络基于关键字执行语音识别。 关键词识别器通过填充模型(160)从填充模型(160)从语音信号的特定向量中提取非关键字,以仅提取关键字,并且识别和提取能够限制关键字搜索网络的大小的关键字,从通过 关键词搜索网络。

    대응 문형 패턴 기반 자동통역 방법 및 장치
    49.
    发明公开
    대응 문형 패턴 기반 자동통역 방법 및 장치 失效
    自动语音翻译方法和设备基于相应的句型

    公开(公告)号:KR1020080040960A

    公开(公告)日:2008-05-09

    申请号:KR1020060108979

    申请日:2006-11-06

    CPC classification number: G10L15/18 G06F17/2872 G10L13/10

    Abstract: An automatic speech translation method and an apparatus thereof based on corresponding sentence pattern are provided to simplify the structure and operations by offering a method of the speech translation based on sentence patterns instead of a text. An automatic speech translation apparatus comprises a voice recognizer(100), a language translator(200) and a voice synthesizer(300). The voice recognizer outputs vocabularies corresponding to a class included in an input sentence pattern and the input sentence pattern by searching a sentence pattern network about the input voice signals. The language translator outputs the sentence pattern and the vocabularies of the class of a translation language by using a corresponding relation sentence dictionary and a translation language dictionary by accepting the input sentence pattern and the vocabularies of the class. The voice synthesizer outputs the synthesized voice by searching rhythm data corresponding to the sentence pattern of the translation language from a sentence pattern rhythm data dictionary.

    Abstract translation: 提供了一种基于相应句型的自动语音翻译方法及其装置,通过提供基于句子模式而不是文本的语音翻译方法来简化结构和操作。 自动语音翻译装置包括语音识别器(100),语言翻译器(200)和语音合成器(300)。 语音识别器通过搜索关于输入语音信号的句型网络来输出与包括在输入语句模式中的类相对应的词汇和输入语句模式。 语言翻译器通过接受输入的句子模式和类的词汇,通过使用相应的关系句子字典和翻译语言字典输出翻译语言的类的句子模式和词汇表。 语音合成器通过从句子模式节奏数据字典中搜索与翻译语言的句型相对应的节奏数据来输出合成语音。

    종결어휘와 피치를 이용한 문형정보 추출방법
    50.
    发明公开
    종결어휘와 피치를 이용한 문형정보 추출방법 失效
    使用一个字和PITCH的结尾的声音类型的提取方法

    公开(公告)号:KR1020050046121A

    公开(公告)日:2005-05-18

    申请号:KR1020030080118

    申请日:2003-11-13

    Inventor: 박경현 박준

    Abstract: 본 발명은 종결어휘와 피치를 이용한 문형정보 추출방법에 관한 것으로, 자동통역 장치의 음성인식 결과에 따른 종결어휘를 이용하여 1차적으로 문형정보를 추출하고, 2차적으로 음성으로부터 피치를 추출한 후, 종결어휘의 문형별 출현 빈도율과 조합하여 문형정보를 추출함으로서 보다 높은 정확률을 얻을 수 있다.
    본 발명은 문형별 종결어휘 사전을 이용하여 음성인식 장치로부터 전달된 음성인식 결과에 따른 문형정보를 추출하는 1차 문형판단 단계와, 상기 1차 문형판단 단계에서 문형정보가 추출되었는가 판단하여, 상기 문형정보가 추출되었을 경우, 언어번역 장치로 상기 문형정보와 음성인식 결과를 전달하는 단계와, 상기 1차 문형판단 단계에서 문형정보가 추출되지 않았을 경우, 입력된 음성으로부터 피치를 검출하고, 문형별 출현 빈도율을 계산하는 단계 및 상기 문형별 출현 빈도율과 피치의 선형조합 방법에 의해 파라메터를 결정하여 문형정보를 추출하는 2차 문형판단 단계로 이루어진다.

Patent Agency Ranking