시스템과 다수 사용자 간의 대화 인터페이스 장치
    31.
    发明公开
    시스템과 다수 사용자 간의 대화 인터페이스 장치 有权
    通信接口设备和多用户和系统的方法

    公开(公告)号:KR1020110059248A

    公开(公告)日:2011-06-02

    申请号:KR1020090115914

    申请日:2009-11-27

    Abstract: PURPOSE: A chatting interface apparatus between a system and a user is provided to supply an interface of high reliability by transferring a control command of a user and to transfer a control command of a user. CONSTITUTION: A first processing unit(203) receives voice/face information from a user. Voice information of the user is determined based on a user model. A second processing unit(204) receives face information. A third processing unit(205) receives the voice information and analyzes the meaning of the voice information.

    Abstract translation: 目的:提供系统和用户之间的聊天界面装置,通过传送用户的控制命令并传送用户的控制命令来提供高可靠性的接口。 构成:第一处理单元(203)从用户接收语音/面部信息。 基于用户模型确定用户的语音信息。 第二处理单元(204)接收面部信息。 第三处理单元(205)接收语音信息并分析语音信息的含义。

    음성 검출 장치 및 방법
    32.
    发明公开
    음성 검출 장치 및 방법 有权
    用于检测语音及其方法的装置

    公开(公告)号:KR1020100115093A

    公开(公告)日:2010-10-27

    申请号:KR1020090033634

    申请日:2009-04-17

    CPC classification number: G10L25/78 G10L25/09 G10L25/18 G10L25/24 G10L25/90

    Abstract: PURPOSE: A voice detecting device and a method thereof used to decide whether the input signal is voice or not are provided to increase the accuracy of the voice detection by controlling the operation for updating the data. CONSTITUTION: A feature information extraction unit(110) includes audio information from a frame. An internal state determining unit(120) uses one or more feature information about the frame. A behavior determination unit(130) controls the volume activity detection operation.

    Abstract translation: 目的:提供用于判定输入信号是否为语音的语音检测装置及其方法,以通过控制用于更新数据的操作来提高语音检测的精度。 构成:特征信息提取单元(110)包括来自帧的音频信息。 内部状态确定单元(120)使用关于该帧的一个或多个特征信息。 行为确定单元(130)控制体积活动性检测操作。

    휴대 단말기에서 음성 인식에 의한 멀티미디어 데이터 검색방법 및 그 장치
    34.
    发明授权
    휴대 단말기에서 음성 인식에 의한 멀티미디어 데이터 검색방법 및 그 장치 有权
    휴대단말기에서음음성인식에의한멀티미디어데이터검색방법및그장치

    公开(公告)号:KR100735820B1

    公开(公告)日:2007-07-06

    申请号:KR1020060020089

    申请日:2006-03-02

    Abstract: A method for searching for multimedia data through a speech recognition in a portable terminal and an apparatus thereof are provided to convert a list of music titles into information used in recognition at a music storage or download site or at the portable terminal itself. A method for searching for multimedia data through a speech recognition in a portable terminal includes the following several steps. The portable terminal enables a user to input a speech query(610). The portable terminal extracts a speech feature vector from the inputting speech query(620). The portable terminal decodes the extracted speech feature vector sequence into a candidate phone sequence(630). The portable terminal performs a partial matching operation by using the candidate phone sequence and a lexicon reference pattern stored at a music database(640). The portable terminal performs a detailed matching procedure on a phone segment matched with a candidate recognition list attained via the partial matching operation through an alignment procedure(650). The portable terminal calculates a matching score in accordance with the matching procedure(660). The portable terminal displays a music information search result by the calculated matching score(670).

    Abstract translation: 提供了一种用于在便携式终端中通过语音识别搜索多媒体数据的方法及其装置,用于将音乐标题列表转换为在音乐存储或下载站点或便携式终端本身识别时使用的信息。 在便携式终端中通过语音识别搜索多媒体数据的方法包括以下几个步骤。 便携式终端使用户能够输入语音查询(610)。 便携式终端从输入语音查询中提取语音特征矢量(620)。 便携式终端将提取的语音特征矢量序列解码成候选电话序列(630)。 便携式终端通过使用候选电话序列和存储在音乐数据库中的词典参考模式来执行部分匹配操作(640)。 便携式终端通过对齐过程(650)在与经由部分匹配操作获得的候选识别列表相匹配的电话段上执行详细匹配过程。 便携式终端根据匹配程序计算匹配分数(660)。 便携式终端通过计算出的匹配分数来显示音乐信息搜索结果(670)。

    서브 렉시컬 노드 생성 장치, 이를 이용한 음성 인식 장치및 방법
    35.
    发明授权
    서브 렉시컬 노드 생성 장치, 이를 이용한 음성 인식 장치및 방법 有权
    子词汇节点生成器,用于使用子词汇节点生成器识别词典的装置和方法

    公开(公告)号:KR100714720B1

    公开(公告)日:2007-05-04

    申请号:KR1020050011700

    申请日:2005-02-11

    Abstract: 본 발명은 음성 인식에서의 탐색망 구축에 필요한 메모리를 감축시킬 수 있는 서브 렉시컬 노드 생성 장치, 이를 이용한 음성 인식 장치 및 방법에 관한 것이다.
    본 발명의 실시예에 따른 서브 렉시컬 노드 생성 장치를 이용한 음성 인식 장치는 인식 대상 어휘들에 적용되는 렉시컬 노드 중에서 각 어휘에게 중복 사용되는 렉시컬 노드들을 포함하는 서브 렉시컬 노드를 생성하고, 생성된 서브 렉시컬 노드를 이용하여 탐색망을 구축하는 서브 렉시컬 노드 생성 장치와, 구축된 탐색망을 이용하여 현재 입력된 음성 신호와 매칭되는 어휘를 탐색하는 서브 렉시컬 노드 생성 장치를 이용한 음성 인식 장치를 포함한다.
    음성 인식, 어휘, 탐색망 구축

    모델 변이 기반의 화자 클러스터링 방법, 화자 적응 방법및 이들을 이용한 음성 인식 장치
    36.
    发明授权
    모델 변이 기반의 화자 클러스터링 방법, 화자 적응 방법및 이들을 이용한 음성 인식 장치 有权
    基于模型变换的扬声器聚类方法和扬声器适应方法,以及使用该方法的装置

    公开(公告)号:KR100612840B1

    公开(公告)日:2006-08-18

    申请号:KR1020040010663

    申请日:2004-02-18

    CPC classification number: G10L15/07 G10L15/142

    Abstract: 양적 변화량 및 방향적 변화량을 고려한, 화자별 평균적인 모델 변이 유사도 정보를 이용함으로써 화자 클러스터링 및 화자 적응 성능을 높인 음성 인식 방법 및 장치가 개시된다. 본 발명에 따른 화자 클러스터링 방법은, 화자 독립 모델과 훈련 화자의 ML 모델 사이의 모델 변이의 유사성을 바탕으로 화자 그룹 모델 변이를 생성한다. 또한, 본 발명에 따른 화자 적응 방법은, 시험 화자의 ML 모델과 그 시험 화자가 속한 화자 그룹의 ML 모델 사이의 모델 변이가 훈련 화자 그룹 모델 변이와 가장 유사한 것을 찾아 화자 적응을 수행한다. 이 때, 화자 클러스터링과 화자 적응시의 모델 변이 계산은 모델들의 양적 변화량 및 방향적 변화량을 모두 고려하여 수행된다. 본 발명은 MLLR 또는 MAP 어느 화자 적응 알고리즘에도 적용이 가능하다.
    화자 클러스터링, 화자 적응, 모델 파라미터, 모델 변이

    음소 결합정보를 이용한 연속 음성인식방법 및 장치
    37.
    发明授权
    음소 결합정보를 이용한 연속 음성인식방법 및 장치 失效
    使用电话连接信息进行语音识别的方法和装置

    公开(公告)号:KR100486733B1

    公开(公告)日:2005-05-03

    申请号:KR1020030011345

    申请日:2003-02-24

    CPC classification number: G10L15/187 G10L15/02

    Abstract: 음소 결합정보를 이용한 연속 음성인식방법 및 장치가 개시된다. 음소 결합정보를 이용한 연속 음성인식방법은 (a) 각 표제어에 대하여 음운변화가 반영된 발음표기가 수록되며, 표제어간 음운변화에 의하여 상기 앞 표제어에서 마지막 음절의 종성이나 뒷 표제어에서 첫 음절의 초성의 철자와 발음이 동일하지 않은 경우 해당 표제어의 종성 또는 초성에 대한 발음표기에 별도의 식별자를 추가하여 발음사전 데이터베이스를 구축하는 단계; (b) 한국어의 기본음소와 식별자가 추가된 2차적 음소를 이용하여 앞 표제어의 종성에 결합가능한 뒷 표제어의 초성을 대응시켜 가능한 모든 결합으로 이루어진 음소결합정보를 매트릭스화하는 단계; 및 (c) 입력되는 음성으로부터 생성되는 특징벡터에 대하여 상기 발음사전 데이터베이스 및 상기 음소결합정보를 이용하여 음성인식을 수행하는 단계를 포함한다.

Patent Agency Ranking