차량용 네비게이션 단말기의 음성인식 방법
    91.
    发明授权
    차량용 네비게이션 단말기의 음성인식 방법 失效
    提供车辆导航系统中语音识别的方法

    公开(公告)号:KR101005786B1

    公开(公告)日:2011-01-06

    申请号:KR1020080125434

    申请日:2008-12-10

    Abstract: 본 발명은 차량용 네비게이션 단말기의 음성인식용 발화 이형태 생성을 위한 POI(points of interest) 대상, 복합명사 분해 및 태깅(tagging) 방법을 제시한다. 소형 차량 네비게이션 단말기 탑재 음성 인식 엔진은 일반적으로 고립어를 인식 대상으로 한다. 고립어는 지도상의 특정 지점에 대한 명칭이며, 이러한 명칭에 대해 사용자는 다양한 발화 이형태를 가진다. 본 발명은 사용자의 다양한 발화 이형태 생성을 위해, 지역 명칭으로 기술된 복합명사 형태의 어휘를 대상으로 복합 명사 분해 및 태깅 방법론을 제시한다. 분해는 차트 기반 동적 프로그래밍 방법론을 기반으로 하고, 태깅은 최대 엔트로피를 기반으로 하여 POI명칭을 구성하는 단일어 각각에 대한 의미 표지를 부착한다.
    복합명사, 복합명사분해, 태깅, POI, 이형태

    음성 인식을 위한 화자 적응 장치 및 그 방법
    92.
    发明公开
    음성 인식을 위한 화자 적응 장치 및 그 방법 无效
    扬声器适应装置及其语音识别方法

    公开(公告)号:KR1020100073178A

    公开(公告)日:2010-07-01

    申请号:KR1020080131772

    申请日:2008-12-22

    Abstract: PURPOSE: A speaker adaptation apparatus and a method for speech recognition are provided to remarkably improve the performance of a speaker by estimating the answer of actual speech data in high possibility through an N-best recognition result screen output function. CONSTITUTION: A voice data verification unit(202) obtains measurement data for each phoneme with regard to accumulation data through reliability evaluation. The accumulation data includes voice data and N-best recognition result data. A sound model speaker adapting unit(204) performs speaker adaptation by measurement data for each acquired per-phoneme. A sound model updating unit(206) updates a sound model by a new speaker-subordinate sound model through performed speaker adaptation.

    Abstract translation: 目的:提供一种扬声器适配装置和语音识别方法,以通过N最佳识别结果屏幕输出功能估计高可能性的实际语音数据的答案来显着提高扬声器的性能。 构成:语音数据验证部(202)通过可靠性评价获取关于累积数据的每个音素的测量数据。 累积数据包括语音数据和N最佳识别结果数据。 声音扬声器适配单元(204)通过每个获取的每个音素的测量数据执行说话者适应。 声音模型更新单元(206)通过执行的说话者自适应通过新的说话者 - 从属声音模型来更新声音模型。

    채널추정 기반 변별학습을 이용한 환경적응 방법
    93.
    发明公开
    채널추정 기반 변별학습을 이용한 환경적응 방법 有权
    使用基于通道估计的判别培训进行环境调整的方法

    公开(公告)号:KR1020100072747A

    公开(公告)日:2010-07-01

    申请号:KR1020080131239

    申请日:2008-12-22

    Abstract: PURPOSE: A method for environment adaptation using discrimination training based on channel estimation is provided to find channel characteristic about adaptation data maintaining discrimination primarily and perform model conversion and combine converted model with discrimination learning technique thereby providing effective environmental adaptation. CONSTITUTION: A noise removing unit(110) eliminates noise component within training data(101). A base recognition performing unit(130) recognizes adaptive data(103). A channel characteristic estimator obtains statistical model about phoneme unit by right data(104) of the adaptation data. The channel characteristic estimator combines the statistical model to base sound model(102). A discrimination environment adapting unit(150) outputs adaptive sound model(106) after change of the statistical model by adaptation of discrimination learning technique.

    Abstract translation: 目的:提出一种使用基于信道估计的鉴别训练进行环境适应的方法,主要查找关于自适应数据维持鉴别的信道特性,并执行模型转换,并将转换模型与识别学习技术相结合,从而提供有效的环境适应。 构成:噪声去除单元(110)消除训练数据(101)内的噪声分量。 基本识别执行单元(130)识别自适应数据(103)。 信道特征估计器通过适配数据的正确数据(104)获得关于音素单元的统计模型。 信道特征估计器将统计模型与基础声音模型(102)相结合。 鉴别环境适应单元(150)在通过识别学习技术的适应改变统计模型之后输出自适应声音模型(106)。

    리모트 컨트롤러, 입력 인터페이스 제어 장치 및 방법
    94.
    发明公开
    리모트 컨트롤러, 입력 인터페이스 제어 장치 및 방법 有权
    远程控制器,控制输入接口的方法和装置

    公开(公告)号:KR1020100072744A

    公开(公告)日:2010-07-01

    申请号:KR1020080131236

    申请日:2008-12-22

    CPC classification number: H04N21/42212 G06F3/16 G10L15/28

    Abstract: PURPOSE: A remote controller, a method and an apparatus for controlling an input interface are provided to enable a user to conveniently input a Hangul, English, number and symbol character through a keypad. CONSTITUTION: An input keypad(1100) combines two keys among a number key, an asteroid key, a sharp key, a directional key and a special character key. The input keypad selects one of input among the Hangul, English and number characters and symbol, and a control unit(1200) recognizes a key operation through the input keypad. The control unit process a key signal corresponding to the recognized key operation, and a wireless transmission unit(1400) transmits the key signal processed in the control unit.

    Abstract translation: 目的:提供用于控制输入接口的遥控器,方法和装置,以使用户能够通过键盘方便地输入韩文,英文,数字和符号字符。 构成:输入键盘(1100)组合数字键,小行星键,锐利键,方向键和特殊字符键中的两个键。 输入键盘选择韩文,英文和数字字符和符号中的一个输入,控制单元(1200)通过输入键盘识别键操作。 控制单元处理与所识别的键操作对应的键信号,无线发送单元(1400)发送在控制单元中处理的键信号。

    음성인식기에서 가비지 및 반단어 모델 기반의 거절 장치 및 방법
    95.
    发明公开
    음성인식기에서 가비지 및 반단어 모델 기반의 거절 장치 및 방법 有权
    用于语音识别的基于拒绝的语音和反义词模型的装置和方法

    公开(公告)号:KR1020100068530A

    公开(公告)日:2010-06-24

    申请号:KR1020080126924

    申请日:2008-12-15

    Abstract: PURPOSE: A rejection apparatus and a method of a garbage and anti-word model base in voice recognition are provided to effectively reject various operating noise or an unenrolled word by implementing a rejection process about a recognized word. CONSTITUTION: An extracting unit(104) extracts a feature vector from a voice signal. A searcher(110) gives a score through a pattern matching about the feature vector and outputs a recognition result. A rejection network generator(114) generates 'the rejection network for a rejection evaluation' through the recognition result. A rejection searcher(124) outputs a recognition score of 'word model comprising the rejection network' based on a garbage sound model. A decision logic unit(128) decides the rejection about the recognized word comparing with the recognition scores.

    Abstract translation: 目的:提供语音识别中的垃圾和反词模型的拒绝装置和方法,以通过对识别的字进行拒绝处理来有效地拒绝各种操作噪声或未注册的单词。 构成:提取单元(104)从语音信号中提取特征向量。 搜索者(110)通过与特征向量匹配的模式给出得分,并输出识别结果。 拒绝网络发生器(114)通过识别结果产生“拒绝评估的拒绝网络”。 拒绝搜索器(124)基于垃圾声音模型输出包括拒绝网络的单词模型的识别分数。 决定逻辑单元(128)决定与识别分数相比的所识别的字的拒绝。

    유비쿼터스 지능형 로봇을 이용한 홈 네트워크 서비스 방법
    96.
    发明公开
    유비쿼터스 지능형 로봇을 이용한 홈 네트워크 서비스 방법 失效
    使用UBIQUITIOUS ROBOTIC COMPANION的家庭网络服务方法

    公开(公告)号:KR1020100066918A

    公开(公告)日:2010-06-18

    申请号:KR1020080125435

    申请日:2008-12-10

    CPC classification number: H04L12/2812

    Abstract: PURPOSE: A home network service method using a ubiquitous intelligent robot for offering a service for a location of a user and a robot for the coordinate information are provided to no need to use a remote controller by supplying robot performing voice input through a location sensor. CONSTITUTION: User interface information is inputted through a ubiquitous intelligent robot. The inputted user interface information is transmitted to the ubiquitous intelligent robot server(S300, S302). The ubiquitous intelligent robot server refers to the multimedia device having the multimedia information corresponding to the user interface information from a home network device group(S304). If the multimedia device is detected, the information search result user interface information is outputted through the ubiquitous intelligent robot.

    Abstract translation: 目的:通过提供通过位置传感器执行语音输入的机器人,无需使用遥控器,使用无处不在的智能机器人为用户和机器人的位置提供坐标信息的家庭网络服务方法。 构成:通过无处不在的智能机器人输入用户界面信息。 输入的用户界面信息被发送到无处不在的智能机器人服务器(S300,S302)。 无处不在的智能机器人服务器是指具有与来自家庭网络设备组的用户界面信息相对应的多媒体信息的多媒体设备(S304)。 如果检测到多媒体设备,则通过无处不在的智能机器人输出信息搜索结果用户界面信息。

    연속 숫자의 음성 인식에 있어서 혼동행렬과 신뢰도치 기반의 다중 인식후보 생성 장치 및 방법
    97.
    发明公开
    연속 숫자의 음성 인식에 있어서 혼동행렬과 신뢰도치 기반의 다중 인식후보 생성 장치 및 방법 有权
    基于混合矩阵产生N-BEST假设的设备和方法和连接数字语音识别中的信心度量

    公开(公告)号:KR1020100062831A

    公开(公告)日:2010-06-10

    申请号:KR1020090027532

    申请日:2009-03-31

    Abstract: PURPOSE: A multiple recognition candidate formation apparatus and a method thereof are provided, which can improve the efficiency of the voice recognition engine by reducing the usage amount of a memory unit and search time for creating the multiple recognition candidate. CONSTITUTION: A voice feature extractor(502) creates the feature vector through the voice recognition about the consecutive numbers voice. A search unit(504) creates the single recognition candidate string through the pattern recognition about the feature vector. The search unit outputs the likelihood point and feature vector about discrete numerical sound composed of the single recognition candidate string. A multiple recognition candidate generation part(508) creates the multiple recognition candidate by referring the order by numerical sound of the confidence measure generator(506) and the pre-set confusion matrix.

    Abstract translation: 目的:提供一种多重识别候选者形成装置及其方法,其通过减少存储单元的使用量和创建多个识别候选者的搜索时间来提高语音识别引擎的效率。 构成:语音特征提取器(502)通过关于连续数字语音的语音识别来创建特征向量。 搜索单元(504)通过关于特征向量的模式识别创建单个识别候选串。 搜索单元输出关于由单个识别候选串组成的离散数字声音的似然点和特征向量。 多重识别候选产生部分(508)通过将置信度测量发生器(506)的数字声音和预设混淆矩阵参考顺序来创建多个识别候选。

    부대역의 불확실성 정보를 이용한 잡음환경에서의 음성인식 방법 및 장치
    98.
    发明授权
    부대역의 불확실성 정보를 이용한 잡음환경에서의 음성인식 방법 및 장치 失效
    用于语音识别的方法和装置,使用噪声环境中的不确定性信息

    公开(公告)号:KR100919223B1

    公开(公告)日:2009-09-28

    申请号:KR1020070095401

    申请日:2007-09-19

    Inventor: 정호영 강병옥

    CPC classification number: G10L15/20 G10L25/18

    Abstract: 본 발명은 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성 인식 방법 및 장치에 관한 것으로, 잡음 신호 모델링을 통해 얻어진 추정 음성에서 각 부대역별로 추정 음성의 불확실성 정보를 추출하여 이를 각 부대역에 대한 가중치로 이용하여 잡음에 강한 음성 특징을 추출하고, 상기 각 부대역 가중치에 따라 음향 모델을 변환하여 변환된 음향 모델과 상기 추출된 음성 특징을 기반으로 음성 인식을 수행함으로써, 시간에 따른 잡음 모델링이 정확하지 않더라도 부대역의 불확실성 정보에 따라 불확실성이 높은 부대역의 영향을 줄여 잡음환경에서도 음성 인식 성능을 향상시킬 수 있는 것을 특징으로 한다.

    음성 인식 방법
    99.
    发明公开
    음성 인식 방법 有权
    语音识别方法

    公开(公告)号:KR1020090041923A

    公开(公告)日:2009-04-29

    申请号:KR1020070107705

    申请日:2007-10-25

    Abstract: A voice recognition method is provided to model various textual language phenomenons into statistical modeling among various knowledge sources. A morpheme is interpreted for a primitive text language corpus consisting of the separate words of Korean(S201). A morpheme language corpus separated is a separate word generated to morpheme. A word trigram which is the language model consisting of a morpheme unigram about a generated morpheme language corpus as described above, and bigram and trigrams is generated(S202). A first N - best recognition candidate to the maximum N is generated for a voice(S204). Recognition result candidates applying a morph-syntactic constraints are revaluated(S205). A second N-best list generated in above step is revaluated(S206). A final N-best list is generated.

    Abstract translation: 提供语音识别方法,将各种文本语言现象建模成各种知识源之间的统计建模。 语素被解释为由韩语单词组成的原始文本语言语料库(S201)。 分离语素语言语料是一个单独的语素词。 生成由上述生成的语素语言语料库的词素单词组成的语言模型的单词trigram,并且生成二进制和三元组(S202)。 为语音产生最大N的第N个最佳识别候选(S204)。 重新评估应用变形语法约束的识别结果候选(S205)。 在上述步骤中生成的第二个N最佳列表被重新评估(S206)。 生成最终的N最佳列表。

    음성 인식 장치 및 방법
    100.
    发明授权
    음성 인식 장치 및 방법 失效
    用于识别语音的装置和方法

    公开(公告)号:KR100737343B1

    公开(公告)日:2007-07-09

    申请号:KR1020060053775

    申请日:2006-06-15

    Inventor: 강병옥

    Abstract: 본 발명은 음성 신호의 특징 벡터를 이용하여 음성 인식을 수행하는 장치에 있어서, 상기 특징 벡터를 이용하여 활성 노드를 선택하는 활성 노드 선택부, 상기 활성 노드 선택부에서 선택된 활성 노드의 수를 이용하여 관측 확률 계산 방식을 결정하는 관측 확률 계산 방식 결정부, 상기 관측 확률 계산 방식 결정부에서 결정된 방식에 따라 관측 확률을 구하는 관측 확률 계산부, 상기 관측 확률 계산부에서 구해진 관측 확률을 이용하여 음성 인식을 수행하고 그 결과를 출력하는 음식 인식 결과 생성부로 구성된 것으로서, 활성 노드의 수에 따라 관측 확률 계산 방식을 다르게 선택하므로 음성 인식률이 증가되고 인식 속도가 향상될 수 있다.
    음성인식, HMM, 관측확률, 활성노드

Patent Agency Ranking