자연어 음성 인식에서 오인식 뭉치 구간을 검출하는 방법
    51.
    发明公开
    자연어 음성 인식에서 오인식 뭉치 구간을 검출하는 방법 审中-实审
    一种用于在自然语言语音识别中检测错误识别间隔的方法

    公开(公告)号:KR1020170109178A

    公开(公告)日:2017-09-28

    申请号:KR1020160032897

    申请日:2016-03-18

    Abstract: 본발명의실시예에따른자연어음성인식에서오인식뭉치구간을검출하는방법은, 외부로부터입력된음성으로부터특징벡터를추출하는단계, 상기특징벡터에대하여음향모델과언어모델을사용하여제 1 비터비디코딩을수행하는단계, 상기특징벡터에대하여음향모델과언어모델을사용하여제 2 비터비디코딩을수행하는단계, 그리고상기제 1 비터비디코딩에따라획득된제 1 문자열및 제 1 시간정보와상기제 2 비터비디코딩에따라획득된제 2 문자열및 제 2 시간정보를비교하는단계를포함할수 있다. 상기제 2 비터비디코딩수행시의언어모델에대한가중치는 0일수 있다.

    Abstract translation: 一种用于检测在自然语言语音识别一个错误识别的一串间隔,根据本发明的一个实施例方法包括:从来自外部的声音输入中提取特征向量的步骤,通过使用声学模型和关于该特征的语言模型向量的第一维特比 执行解码,该方法中,和第一字符串,并根据通过使用声学模型和语言模型相对于所述特征向量和所述执行第二维特比解码所述第一维特比译码中获得的第一时间信息 并比较根据第二维特比解码获得的第二串和第二时间信息。 执行第二维特比解码时的语言模型的权重可以是零。

    액티브 3D 마이크 그리드 맵을 형성 및 이용하는 서비스 시스템 및 그 동작 방법
    52.
    发明公开
    액티브 3D 마이크 그리드 맵을 형성 및 이용하는 서비스 시스템 및 그 동작 방법 审中-实审
    用于形成和利用有源3D麦克风网格图的服务系统及其操作方法

    公开(公告)号:KR1020170086220A

    公开(公告)日:2017-07-26

    申请号:KR1020160005774

    申请日:2016-01-18

    Abstract: 본발명은액티브 3D 마이크그리드맵을형성및 이용하는서비스시스템및 그동작방법에관한것으로서, 본발명의실시예에따른액티브 3D 마이크그리드맵을형성및 이용하는서비스시스템은다수의스마트기기로부터현재상태정보를수신하는수신부, 수신된상기현재상태정보를기반으로상기다수의스마트기기에대한액티브 3D 마이크그리드맵을형성하는형성부, 및형성된상기액티브 3D 마이크그리드맵을이루는상기다수의스마트기기로부터수신되는소리신호를기반으로기능을동작하는제어부를포함한다.

    Abstract translation: 本发明涉及一种用于形成和使用有源3D麦克风网格地图的服务系统,以及用于形成和使用根据本发明实施例的有源3D麦克风网格地图的服务系统, 接收单元,用于接收当前状态信息;形成单元,用于基于接收到的当前状态信息形成用于多个智能设备的有效3D麦克风网格图;以及声音接收单元 以及用于基于该信号操作功能的控制单元。

    음성인식시스템에서 발화검증 방법 및 그 음성인식시스템
    53.
    发明授权
    음성인식시스템에서 발화검증 방법 및 그 음성인식시스템 有权
    语音识别系统中的语音识别方法和语音识别系统

    公开(公告)号:KR101752709B1

    公开(公告)日:2017-06-30

    申请号:KR1020100125869

    申请日:2010-12-09

    Inventor: 강점자 이윤근

    Abstract: 본발명은음성인식시스템에서발화검증방법및 음성인식시스템을제공한다. 상기발화검증방법은음성이입력되면잡음처리및 음성구간검출을위한음성끝점검출과음성특징추출을수행하는단계와, 상기음성끝점과음성특징에기반하여비터비탐색을통해엔베스트음성인식을수행하는단계와, 상기엔베스트음성인식을수행한후 모노폰반모델기반의신뢰도측정값 및엔베스트트라이폰반모델기반의신뢰도측정값을구하는단계와, 상기모노폰반모델기반의신뢰도측정값 및상기엔베스트트라이폰반모델기반의신뢰도측정값을결합하여기준신뢰도측정값을구하는단계와, 상기기준신뢰도측정값과미리결정된문턱치값과비교하여상기엔베스트음식인식결과에대한발화검증을수행하는단계를포함한다.

    Abstract translation: 本发明提供语音识别系统中的语音识别验证方法和语音识别系统。 所述发声验证方法通过步骤执行日元最好语音识别,和维特比的语音结束点的基础和一个语音特征,它执行语音结束点检测和用于噪声处理的语音特征提取和语音间隔当语音被输入检测在搜索 在进行最佳语音识别之后,基于单音模型和基于最优三音模型模型的可信度测量值获得可信度测量值的步骤, 这将是日元进行烧成验证的最佳食品识别结果相比,三ponban的方法由参考置信度量的可靠性措施与预定阈值进行组合,以获得基于模型的参考可靠性测量 。

    음성인식 시스템에서 유사도를 기반으로 한 비인식 대상 단어 생성 방법
    54.
    发明授权
    음성인식 시스템에서 유사도를 기반으로 한 비인식 대상 단어 생성 방법 有权
    基于语音识别系统中的类似性产生非齐次性的方法

    公开(公告)号:KR101711941B1

    公开(公告)日:2017-03-03

    申请号:KR1020120146925

    申请日:2012-12-14

    Abstract: 음성인식시스템에서유사도기반비인식대상단어(OOV: Out-of-Vocabulary) 생성방법에관한것이다. 이러한본 발명의비인식대상단어생성방법은음성평가데이터가준비되면, 단어별음소열을갖는인식대상단어사전을생성하는단계; 음성평가데이터에서비인식대상단어를선정한후, 비인식대상단어와인식대상단어사전에저장된적어도하나의인식대상단어의음소열을비교하여유사도를계산하는단계; 적어도하나의인식대상단어중 유사도가제 1 범위에포함되는인식대상단어를제 1 그룹으로구분하여비인식대상단어사전에추가하고문법을수정하는단계; 및적어도하나의인식대상단어중 유사도가제 2 범위에포함되는인식대상단어를제 2 그룹으로구분하여비인식대상단어사전에추가하는단계를포함하는것을특징으로한다.

    Abstract translation: 本发明涉及一种基于语音识别系统中的相似度来生成超出词汇(OOV)的方法。 根据本发明的用于生成OOV的方法包括以下步骤:当准备语音测试数据时,生成要被识别的词汇的词典,其具有每个词汇表具有音素串; 从所述语音测试数据中选择OOV,比较所述OOV的音素字符串和要被识别的至少一个要被识别的词汇表的词汇,并且计算相似度; 将要被识别的具有相似性的词汇分类为包含在要识别的至少一个词汇表中的第一范围内的词汇,将要识别的词汇添加到OOV的词典中,并修改语法; 并且将要被识别的词汇表分类为包含在要识别的至少一个词汇表中的第二范围中的相似性的词汇,并将要识别的词汇添加到OOV的词典中。

    SNS에 기반한 재난 정보 전송 장치 및 방법
    55.
    发明公开
    SNS에 기반한 재난 정보 전송 장치 및 방법 审中-实审
    用于发送与灾难相关的信息的SNS装置和方法

    公开(公告)号:KR1020160123749A

    公开(公告)日:2016-10-26

    申请号:KR1020150054306

    申请日:2015-04-17

    Abstract: SNS에기반한재난정보전송장치및 방법이개시된다. 본발명의일실시예에따른 SNS에기반한재난정보전송장치는사용자주위의소음을인지하고, 상기소음을녹음하는녹음부; 상기소음에기반하여재난이발생하였는지여부를판단하는판단부; 및재난이발생하였다고판단한경우, 상기사용자에상응하는 SNS(Social Network Service)에상기재난과관련된정보를게시하는게시부를포함한다.

    한국어 연속 음성인식을 위한 컨퓨젼 네트워크 리스코어링 장치 및 이를 이용한 컨퓨젼 네트워크 생성 방법 및 리스코어링 방법
    57.
    发明授权
    한국어 연속 음성인식을 위한 컨퓨젼 네트워크 리스코어링 장치 및 이를 이용한 컨퓨젼 네트워크 생성 방법 및 리스코어링 방법 有权
    为了连续地使用韩国语音识别的混合网络的装置,以及使用该方法生成和减少混合网络的方法

    公开(公告)号:KR101444409B1

    公开(公告)日:2014-09-30

    申请号:KR1020110072813

    申请日:2011-07-22

    Abstract: 음성인식으로 생성되는 래티스 구조를 컨퓨젼 네트워크 구조로 변환하는 과정에서 래티스 링크 확률의 한계치를 설정하여 컨퓨젼 네트워크의 생성 속도를 향상시키도록 한 한국어 연속 음성인식을 위한 컨퓨젼 네트워크 리스코어링 장치 및 이를 이용한 컨퓨젼 네트워크 생성 방법 및 리스코어링 방법이 제시된다. 제시된 한국어 연속 음성인식을 위한 컨퓨젼 네트워크 리스코어링 장치를 이용한 컨퓨젼 네트워크 생성 방법은 음성인식을 통해 생성되는 하나 이상의 래티스를 입력받는 단계; 입력받은 하나 이상의 래티스들 각각의 사후 확률을 연산하는 단계; 연산한 사후 확률을 근거로 래티스에 포함된 노드를 복수의 동치류로 할당하는 단계; 복수의 동치류를 이용하여 컨퓨젼 세트를 생성하는 단계; 및 생성된 컨퓨젼 세트를 근거로 컨퓨젼 네트워크를 생성하는 단계를 포함한다.

    발음 평가 장치
    58.
    发明公开
    발음 평가 장치 有权
    专利测试系统

    公开(公告)号:KR1020140074636A

    公开(公告)日:2014-06-18

    申请号:KR1020120142816

    申请日:2012-12-10

    CPC classification number: G10L15/10 G10L15/005

    Abstract: According to an embodiment of the present invention, a pronunciation evaluation device is designed to easily evaluate pronunciation of an English voice spoken to be inputted from a phonological aspect and an acoustic aspect of a native English voice. The pronunciation evaluation device comprises: a likelihood ratio measuring module which includes a first null hypothesis calculation unit to calculate a first null hypothesis for an English voice spoken to be inputted, a first alternative hypothesis calculation unit to calculate a first alternative hypothesis corresponding to the first null hypothesis, a second null hypothesis calculation unit to calculate a second null hypothesis for a native English voice set in correspondence to the English voice, and a second alternative hypothesis calculation unit to calculate a second alternative hypothesis corresponding to the second null hypothesis; and a pronunciation scoring module to calculate a pronunciation matching probability value for the English voice in correspondence to the native English voice based on the first and second null hypotheses and the first and second alternative hypotheses.

    Abstract translation: 根据本发明的实施例,发音评价装置被设计为容易地评估从语音方面输入的英语声音和母语英语的声学方面的发音。 发音评估装置包括:似然比测量模块,包括:第一零假设计算单元,用于计算用于输入的英语语音的第一零假设;第一替代假设计算单元,用于计算与第一替代假设相对应的第一替代假设 零假设,第二零假设计算单元,用于计算对应于英语语音的母语英语语音集的第二零假设;以及第二替代假设计算单元,用于计算与第二无效假设相对应的第二替代假设; 以及发音评分模块,用于基于所述第一和第二零假设以及所述第一和第二替代假设来计算与所述母语英语语音相对应的英语语音的发音匹配概率值。

    최대 로그 우도법 기반의 최적 음향모델 생성 장치 및 방법
    59.
    发明公开
    최대 로그 우도법 기반의 최적 음향모델 생성 장치 및 방법 无效
    基于最大记录比例的创建最佳声学模型的装置及其方法

    公开(公告)号:KR1020130068251A

    公开(公告)日:2013-06-26

    申请号:KR1020110135230

    申请日:2011-12-15

    CPC classification number: G10L15/14 G10L15/063

    Abstract: PURPOSE: An optimal acoustic model generating apparatus of a maximum log likelihood base and a method thereof are provided to reduce a calculation during a performance of a voice recognition by estimating 'an acoustic model which has a Gaussian mixture of optimal number' about each tri-phone unit based on a maximum log likelihood estimation. CONSTITUTION: A state occupation probability calculator(104) calculates an occupation probability of each tri-phone unit state. A state log likelihood calculator(106) calculates a log likelihood of each tri-phone unit state. A decision unit of a ML(Maximum Likelihood) mixture by state(110) maps 'the number of mixtures which have the highest log likelihood' in 'the tri-phone unit state which has respective mixture steps'. An optimal acoustic model generator(112) selects a state model of the mapped mixtures from 'the acoustic model of the tri-phone unit state which has various mixture steps' and generates an acoustic model. [Reference numerals] (100) Mixture increasing unit; (102) Repetitive training unit; (104) State occupation probability calculator; (106) State log likelihood calculator; (108) Mixture increase determining unit; (110) State maximum log likelihood mixture determining unit; (112) Optimum sound model generating unit; (AA) Voice data

    Abstract translation: 目的:提供最大对数似然基础的最佳声学模型生成装置及其方法,以通过估计“关于每个三元组的最佳数量的高斯混合的声学模型”来减少语音识别期间的计算, 基于最大对数似然估计的电话单元。 构成:状态占有概率计算器(104)计算每个三电话单元状态的占用概率。 状态对数似然度计算器(106)计算每个三电话单元状态的对数似然度。 根据状态(110)的ML(最大似然)混合的决策单元将具有最高对数似然性的混合物的数目映射在具有各个混合步骤的三电话单元状态中。 最佳声学模型发生器(112)从“具有各种混合步骤的三电话单元状态的声学模型”中选择映射混合的状态模型并产生声学模型。 (附图标记)(100)混合增加单元; (102)重复训练单位; (104)国家占有概率计算器; (106)状态对数似然计算器; (108)混合物增加确定单位; (110)状态最大对数似然混合判定单元; (112)最佳声音模型生成单元; (AA)语音数据

    음질 향상 장치와 음성 인식 시스템 및 방법
    60.
    发明授权
    음질 향상 장치와 음성 인식 시스템 및 방법 有权
    语音改进装置和语音识别系统及方法

    公开(公告)号:KR101239318B1

    公开(公告)日:2013-03-05

    申请号:KR1020080131369

    申请日:2008-12-22

    CPC classification number: G10L21/0208 G10L15/20 G10L25/48

    Abstract: 본 발명은 이동체, 예컨대 주행 중인 차량 내부 환경에서 사용자 음성인터페이스를 위한 음질향상 및 음성 인식 시스템의 성능 향상을 위한 것으로, 이를 위하여 자동차 운행 속도 레벨을 판단하는 방법과 이를 토대로 입력 음성의 음질을 향상 시키기 위한 음질 향상 방법, 자동차 환경에 특화된 음성 활성 검출(voice activity detection, VAD) 방법, 차량 주행 환경에 특화된 음성의 끝점검출(endpoint detection, EPD) 방법, 자동차 운행 속도 레벨에 따른 음성의 특징추출 방법과 음성인식을 위한 decoding 방법을 각각 제안하고 이를 결합함으로써, 정차 혹은 주행중인 자동차 환경에서 사용자 음성인터페이스를 위한 자동 음성 인식(automatic speech recognition, ASR) 성능을 획기적으로 향상시킬 수 있다.
    자동체 주행환경, 음성인식, 음질 향상 및 보상, 음성활성검출, 끝점검출, 특징추출, 다중모델디코딩

Patent Agency Ranking