휴대 단말기에서 음성 인식에 의한 멀티미디어 데이터 검색방법 및 그 장치
    11.
    发明授权
    휴대 단말기에서 음성 인식에 의한 멀티미디어 데이터 검색방법 및 그 장치 有权
    휴대단말기에서음음성인식에의한멀티미디어데이터검색방법및그장치

    公开(公告)号:KR100735820B1

    公开(公告)日:2007-07-06

    申请号:KR1020060020089

    申请日:2006-03-02

    Abstract: A method for searching for multimedia data through a speech recognition in a portable terminal and an apparatus thereof are provided to convert a list of music titles into information used in recognition at a music storage or download site or at the portable terminal itself. A method for searching for multimedia data through a speech recognition in a portable terminal includes the following several steps. The portable terminal enables a user to input a speech query(610). The portable terminal extracts a speech feature vector from the inputting speech query(620). The portable terminal decodes the extracted speech feature vector sequence into a candidate phone sequence(630). The portable terminal performs a partial matching operation by using the candidate phone sequence and a lexicon reference pattern stored at a music database(640). The portable terminal performs a detailed matching procedure on a phone segment matched with a candidate recognition list attained via the partial matching operation through an alignment procedure(650). The portable terminal calculates a matching score in accordance with the matching procedure(660). The portable terminal displays a music information search result by the calculated matching score(670).

    Abstract translation: 提供了一种用于在便携式终端中通过语音识别搜索多媒体数据的方法及其装置,用于将音乐标题列表转换为在音乐存储或下载站点或便携式终端本身识别时使用的信息。 在便携式终端中通过语音识别搜索多媒体数据的方法包括以下几个步骤。 便携式终端使用户能够输入语音查询(610)。 便携式终端从输入语音查询中提取语音特征矢量(620)。 便携式终端将提取的语音特征矢量序列解码成候选电话序列(630)。 便携式终端通过使用候选电话序列和存储在音乐数据库中的词典参考模式来执行部分匹配操作(640)。 便携式终端通过对齐过程(650)在与经由部分匹配操作获得的候选识别列表相匹配的电话段上执行详细匹配过程。 便携式终端根据匹配程序计算匹配分数(660)。 便携式终端通过计算出的匹配分数来显示音乐信息搜索结果(670)。

    서브 렉시컬 노드 생성 장치, 이를 이용한 음성 인식 장치및 방법
    12.
    发明授权
    서브 렉시컬 노드 생성 장치, 이를 이용한 음성 인식 장치및 방법 有权
    子词汇节点生成器,用于使用子词汇节点生成器识别词典的装置和方法

    公开(公告)号:KR100714720B1

    公开(公告)日:2007-05-04

    申请号:KR1020050011700

    申请日:2005-02-11

    Abstract: 본 발명은 음성 인식에서의 탐색망 구축에 필요한 메모리를 감축시킬 수 있는 서브 렉시컬 노드 생성 장치, 이를 이용한 음성 인식 장치 및 방법에 관한 것이다.
    본 발명의 실시예에 따른 서브 렉시컬 노드 생성 장치를 이용한 음성 인식 장치는 인식 대상 어휘들에 적용되는 렉시컬 노드 중에서 각 어휘에게 중복 사용되는 렉시컬 노드들을 포함하는 서브 렉시컬 노드를 생성하고, 생성된 서브 렉시컬 노드를 이용하여 탐색망을 구축하는 서브 렉시컬 노드 생성 장치와, 구축된 탐색망을 이용하여 현재 입력된 음성 신호와 매칭되는 어휘를 탐색하는 서브 렉시컬 노드 생성 장치를 이용한 음성 인식 장치를 포함한다.
    음성 인식, 어휘, 탐색망 구축

    프레임의 신뢰도를 측정하여 음성을 인식하는 방법 및 장치
    13.
    发明公开
    프레임의 신뢰도를 측정하여 음성을 인식하는 방법 및 장치 失效
    通过测量框架的信心来识别语音的方法和装置

    公开(公告)号:KR1020060092544A

    公开(公告)日:2006-08-23

    申请号:KR1020050013521

    申请日:2005-02-18

    CPC classification number: G10L15/08 G10L15/142

    Abstract: 프레임의 신뢰도를 측정하여 음성을 인식하는 방법 및 장치에 관한 것이다.
    본 발명의 일 실시예에 따른 프레임의 신뢰도를 측정하여 음성을 인식하는 방법은 수신한 음성 신호를 소정 길이의 프레임별로 주파수 특징을 구하는 단계, 상기 프레임에 대한 키워드 모델의 우도와 상기 프레임에 대한 필러 모델의 우도를 산출하는 단계, 상기 산출한 두 종류의 우도로 신뢰성 점수를 산출하는 단계 및 상기 신뢰성 점수로 상기 수신한 음성 신호가 핵심어 또는 비핵심어인지 판단하는 단계를 포함한다.
    음성인식, 프레임(frame), 신뢰도, 우도(likelihood), 왜도(skewness)

    모델 변이 기반의 화자 클러스터링 방법, 화자 적응 방법및 이들을 이용한 음성 인식 장치
    14.
    发明授权
    모델 변이 기반의 화자 클러스터링 방법, 화자 적응 방법및 이들을 이용한 음성 인식 장치 有权
    基于模型变换的扬声器聚类方法和扬声器适应方法,以及使用该方法的装置

    公开(公告)号:KR100612840B1

    公开(公告)日:2006-08-18

    申请号:KR1020040010663

    申请日:2004-02-18

    CPC classification number: G10L15/07 G10L15/142

    Abstract: 양적 변화량 및 방향적 변화량을 고려한, 화자별 평균적인 모델 변이 유사도 정보를 이용함으로써 화자 클러스터링 및 화자 적응 성능을 높인 음성 인식 방법 및 장치가 개시된다. 본 발명에 따른 화자 클러스터링 방법은, 화자 독립 모델과 훈련 화자의 ML 모델 사이의 모델 변이의 유사성을 바탕으로 화자 그룹 모델 변이를 생성한다. 또한, 본 발명에 따른 화자 적응 방법은, 시험 화자의 ML 모델과 그 시험 화자가 속한 화자 그룹의 ML 모델 사이의 모델 변이가 훈련 화자 그룹 모델 변이와 가장 유사한 것을 찾아 화자 적응을 수행한다. 이 때, 화자 클러스터링과 화자 적응시의 모델 변이 계산은 모델들의 양적 변화량 및 방향적 변화량을 모두 고려하여 수행된다. 본 발명은 MLLR 또는 MAP 어느 화자 적응 알고리즘에도 적용이 가능하다.
    화자 클러스터링, 화자 적응, 모델 파라미터, 모델 변이

    음소 결합정보를 이용한 연속 음성인식방법 및 장치
    15.
    发明授权
    음소 결합정보를 이용한 연속 음성인식방법 및 장치 失效
    使用电话连接信息进行语音识别的方法和装置

    公开(公告)号:KR100486733B1

    公开(公告)日:2005-05-03

    申请号:KR1020030011345

    申请日:2003-02-24

    CPC classification number: G10L15/187 G10L15/02

    Abstract: 음소 결합정보를 이용한 연속 음성인식방법 및 장치가 개시된다. 음소 결합정보를 이용한 연속 음성인식방법은 (a) 각 표제어에 대하여 음운변화가 반영된 발음표기가 수록되며, 표제어간 음운변화에 의하여 상기 앞 표제어에서 마지막 음절의 종성이나 뒷 표제어에서 첫 음절의 초성의 철자와 발음이 동일하지 않은 경우 해당 표제어의 종성 또는 초성에 대한 발음표기에 별도의 식별자를 추가하여 발음사전 데이터베이스를 구축하는 단계; (b) 한국어의 기본음소와 식별자가 추가된 2차적 음소를 이용하여 앞 표제어의 종성에 결합가능한 뒷 표제어의 초성을 대응시켜 가능한 모든 결합으로 이루어진 음소결합정보를 매트릭스화하는 단계; 및 (c) 입력되는 음성으로부터 생성되는 특징벡터에 대하여 상기 발음사전 데이터베이스 및 상기 음소결합정보를 이용하여 음성인식을 수행하는 단계를 포함한다.

    스테이트별 가중치를 적용한 음성 인식 장치 및 방법
    16.
    发明授权
    스테이트별 가중치를 적용한 음성 인식 장치 및 방법 失效
    基于状态应用权重的语音识别装置和方法

    公开(公告)号:KR100327486B1

    公开(公告)日:2002-03-13

    申请号:KR1020000012052

    申请日:2000-03-10

    Inventor: 최인정 김도영

    Abstract: 스테이트별 가중치를 적용한 음성 인식 장치 및 방법이 공개된다. 음향 문맥에 상응하여 특성 벡터마다 히든 마코프 스테이트별로 특성 벡터의 중요성을 판단하여 화자의 음성을 인식하는 본 발명에 따른 음성 인식 장치는 화자의 음성 신호를 받아들이고, 고정 프레임 율로 음성 신호의 특성 벡터를 추출하고, 추출된 프레임별 특성 벡터에 동일한 가중치를 부여하는 특성 추출부, 학습 데이터 베이스로부터 분별적 방법에 의해 학습된 다층 퍼셉트론에 의해 프레임마다 히든 마코프 스테이트별 가중치를 적용하여, 프레임별로 문맥 의존적인 정보율을 갖는 특성 벡터를 발생하는 프레임 정보율 추출부 및 히든 마코프 모델과 학습 모델들을 이용하여 학습된 다층 퍼셉트론으로부터 추정된 문맥 의존적인 스테이트별 가중치를 갖는 특성 벡터를 인식하는 음성 인식부를 포함하는 것을 특징으로 하고, 주변 음성의 변이 � ��도에 따라 스테이트별 가중치를 달리 부여하므로, 스테이트별로 정보적 중요도를 반영하여 음성을 인식하므로 음성의 오인식률을 크게 줄일 수 있다.

    부분 검색어 추출을 통한 미디어 파일 검색 방법 및 장치
    17.
    发明授权
    부분 검색어 추출을 통한 미디어 파일 검색 방법 및 장치 有权
    通过提取部分搜索词搜索媒体文件的方法和装置

    公开(公告)号:KR100760301B1

    公开(公告)日:2007-09-19

    申请号:KR1020060017769

    申请日:2006-02-23

    Inventor: 김정은 최인정

    CPC classification number: G06F17/30755 G06F17/30749 G06F17/30772

    Abstract: 본 발명은 미디어(media) 파일로부터 추출한 개체명을 이용하여 부분 검색어를 생성하고, 사용자로부터 검색 쿼리(Query)를 입력받은 경우, 음성 인식을 통해 상기 검색 쿼리와 연관된 부분 검색어를 식별하여 상기 부분 검색어와 연관된 미디어 파일을 검색할 수 있는 방법 및 장치에 관한 것이다. 본 발명에 따른 미디어 파일 검색 방법은 미디어 파일로부터 개체명을 추출하는 단계, 상기 추출된 개체명에 대한 띄어쓰기를 복원하는 단계, 상기 띄어쓰기가 복원된 개체명으로부터 부분 검색어를 생성하는 단계, 및 상기 부분 검색어를 이용하여 미디어 파일을 검색하는 단계를 포함한다.
    음악, 미디어 파일, 개체명, 띄어쓰기, 부분 검색어

    다중 계층 중심 어휘 목록에 기초하여 대규모 단어 음성인식 방법 및 그 장치
    18.
    发明授权
    다중 계층 중심 어휘 목록에 기초하여 대규모 단어 음성인식 방법 및 그 장치 有权
    다중계층중심어휘목록에기초하여대규모단어음성인식방법및그장치

    公开(公告)号:KR100748720B1

    公开(公告)日:2007-08-13

    申请号:KR1020060012529

    申请日:2006-02-09

    Abstract: A large-vocabulary speech recognition method on the basis of a multi-layer central lexicon and an apparatus therefor are provided to perform detailed matching only for vocabularies of a region similar to input utterance through a symbol matching process of a phoneme recognized result and a central lexicon in a tree structure. A multi-pass symbol matching unit(140) performs the multi-pass symbol matching between a phoneme recognition string and a pronunciation string of a central lexicon layered as a tree structure. A detailed matching unit(150) performs detail matching for selecting a speed recognition result by using a detailed acoustic model for candidate vocabulary sets selected by the multi-pass symbol matching. The multi-pass symbol matching unit(140) tracks a node which records the maximum matching score per each layer, and repeats a node tracking process until the multi-pass symbol matching unit(140) arrives at the terminating node.

    Abstract translation: 提供了基于多层中央词典的大词汇量语音识别方法及其装置,以通过音素识别结果和中心的词汇识别结果的符号匹配处理仅对与输入话语类似的区域的词汇表进行详细匹配 在树结构的词典。 多通道符号匹配单元(140)执行音素识别串与层叠为树结构的中心词典的发音串之间的多遍符号匹配。 详细匹配单元(150)通过使用由多遍符号匹配选择的候选词汇集的详细声学模型来执行用于选择速度识别结果的细节匹配。 多通道符号匹配单元(140)跟踪每个层记录最大匹配分数的节点,并且重复节点跟踪处理,直到多通道符号匹配单元(140)到达终止节点。

    인식 후보의 사전적 거리를 이용한 인식 신뢰도 측정 방법및 인식 신뢰도 측정 시스템
    19.
    发明授权
    인식 후보의 사전적 거리를 이용한 인식 신뢰도 측정 방법및 인식 신뢰도 측정 시스템 有权
    识别可靠性测量方法和识别可靠性测量系统使用识别候选词典的距离

    公开(公告)号:KR100717385B1

    公开(公告)日:2007-05-11

    申请号:KR1020060012528

    申请日:2006-02-09

    Abstract: 입력 음성 신호로부터 검출한 음소열에 매칭되는 최적한 개수의 인식 후보를 추출하고, 추출된 인식 후보간의 사전적 거리(Lexical Distance) 추정에 따른 음성 신호에 대한 등록 어휘 여부를 정확하게 수행할 수 있는 인식 신뢰도 측정 방법 및 인식 신뢰도 측정 시스템을 개시한다. 인식 신뢰도 측정 방법은, 입력 음성 신호의 특징 벡터로부터 음소열을 추출하는 단계와, 추출된 음소열과 소정의 단어집합(dictionary)에 등록된 어휘의 음소열을 매칭하여 인식 후보를 추출하는 단계와, 추출된 인식 후보간의 사전적 거리(lexical distance)를 추정하는 단계 및 상기 사전적 거리에 기초하여 등록 어휘 여부를 결정하는 단계를 포함한다.
    음성 인식, 신뢰도, 인식 후보, 사전적 거리, 음소열

    Abstract translation: 提取的最佳数量的识别候补,它认识到,可以准确地是否根据现有或所提取的识别候选(词汇的距离)之间的距离为一语音信号中的登记单词来执行估计可靠性输入从语音信号匹配的一列音素检测 公开了一种测量方法和识别可靠性测量系统。 和一个识别置信测量方法,包括在相和将提取的音素热用于从所述语音信号的输入特征向量提取音素热提取识别候选中登记的预定的一组单词(字典)中的词汇的音素列的匹配的步骤; 估计所提取的识别候选之间的词汇距离并基于词典距离确定是否注册词汇。

    음성인식 방법 및 장치, 이를 이용한 네비게이션 시스템
    20.
    发明授权
    음성인식 방법 및 장치, 이를 이용한 네비게이션 시스템 失效
    用于语音识别的方法和装置,以及使用导航系统的方法

    公开(公告)号:KR100679042B1

    公开(公告)日:2007-02-06

    申请号:KR1020040086228

    申请日:2004-10-27

    CPC classification number: G01C21/3629 G01C21/3608 G01C21/3664 G10L15/22

    Abstract: 본 발명은 음성인식에 관한 것이다.
    음성 인식 방법은 사용자가 자연스럽게 발화한 음성을 취득하여 특징을 추출하는 단계와, 상기 특징으로부터 상기 어휘를 구성하는 서브워드들 중에서 첫번째 서브워드의 후보들을 선정하여 디스플레이하는 단계와, 상기 후보들 중에서 사용자가 선택한 서브워드를 기준으로 다음 서브워드의 후보들을 선정하여 디스플레이하는 단계, 및 상기 다음 서브워드로부터 사용자가 어휘를 결정하였는지를 판단하여, 결정되지 않은 경우에 이전까지 선택된 서브워드열을 기준으로 그 다음 서브워드 후보들을 선정하여 디스플레이하는 단계를 포함한다.
    음성 인식, 멀티 모드, 서브워드, 네비게이션 시스템

Patent Agency Ranking