-
公开(公告)号:KR1020160000286A
公开(公告)日:2016-01-04
申请号:KR1020140077479
申请日:2014-06-24
Applicant: 한국전자통신연구원
Inventor: 김동현
Abstract: 본발명의일 실시예에따른음성인식시스템은단말로부터음성데이터및 사용자키를포함하는음성인식요청을수신하고, 사용자키에상응하는변환매개변수및 음향모델에따라음성데이터에상응하는단어열을생성하여단말로전송하는음성인식서비스장치및 변환매개변수및 음향모델을저장하고음성인식서비스장치로변환매개변수및 음향모델을제공하고, 단어열에따라변환매개변수및 음향모델을갱신하는사용자클러스터장치를포함한다.
Abstract translation: 根据本发明实施例的用于识别声音的系统包括:声音识别服务设备,用于从终端接收包括声音数据和用户密钥的声音识别请求,根据一个声音数据生成对应于声音数据的字行 声音模型和对应于用户密钥的转换参数,并将字排发送到终端; 以及用于存储声音模型和转换参数的用户群集设备,将声音模型和转换参数提供给声音识别服务设备,以及根据单词行更新声音模型和转换参数。
-
公开(公告)号:KR1020150031896A
公开(公告)日:2015-03-25
申请号:KR1020130111673
申请日:2013-09-17
Applicant: 한국전자통신연구원
Inventor: 김동현
CPC classification number: G10L15/30 , G10L15/183 , G10L15/187 , G10L2015/228
Abstract: 실시 예는, 음성인식 단말기로부터 입력된 음성에 대응하는 음성 데이터 및 상기 음성의 입력 환경에 대응하는 멀티센서 데이터를 수신하는 통신모듈, 이전 멀티센서 데이터를 기반으로 음성 입력 환경에 따라 구분된 복수의 언어 및 음향 모델 중 상기 멀티센서 데이터에 대응하는 임의의 언어 및 음향 모델을 선정하는 모델선정모듈 및 상기 음성 데이터에서 추출된 특징 벡터를 상기 임의의 언어 및 음향 모델에 적용하여, 상기 음성 데이터에 대한 음성인식결과를 상기 음성인식 단말기로 전송되게 상기 통신모듈을 제어하는 음성인식모듈을 포함하는 음성인식장치를 제공한다.
Abstract translation: 一个实施例提供了一种语音识别装置,包括:通信模块,其接收对应于从语音识别终端输入的语音的语音数据,以及对应于语音的输入环境的多传感器数据; 模型选择模块,基于先前的多传感器数据,根据语音的输入环境来选择与多个语言和声音模型中的多传感器数据相对应的任意语言和声音模型; 以及语音识别模块,将从语音数据提取的特征矢量应用于任意语言和声音模型,以控制通信模块,使得相对于语音数据的语音识别被发送到语音识别终端。
-
33.
公开(公告)号:KR101281958B1
公开(公告)日:2013-07-03
申请号:KR1020110090273
申请日:2011-09-06
Applicant: 한국전자통신연구원
Inventor: 김동현
IPC: G10L15/14
Abstract: 음성 인식 시스템 및 방법이 개시된다. 본 발명의 일실시예에 따른 음성 인식 시스템은, 사용자로부터 입력된 음성 데이터로부터 특징 벡터를 추출하는 특징 추출부; 상기 특징 벡터를 윈도우 크기만큼 선택하는 특징 벡터 선택 및 변환부; 트리 검색을 통하여 상기 윈도우 크기만큼 선택된 특징 벡터에 대응하는 최대 유사 GMM(Gaussian Mixture Model)을 선택하고, 상기 선택된 GMM을 이용하여 변환 매개변수를 측정하는 특징 벡터 적응부; 음향 모델 및 언어 모델을 기록하는 데이터베이스; 및 음성 인식부를 포함하고, 상기 특징 벡터 선택 및 변환부는 상기 변환 매개변수를 이용하여 상기 특징 벡터를 변환하며, 상기 음성 인식부는 상기 변환된 특징 벡터, 상기 음향 모델 및 상기 언어 모델을 이용하여 상기 사용자의 음성을 인식할 수 있다.
-
公开(公告)号:KR1020130059476A
公开(公告)日:2013-06-07
申请号:KR1020110125405
申请日:2011-11-28
Applicant: 한국전자통신연구원
IPC: G10L15/08
CPC classification number: G10L15/083 , G10L15/187 , G10L15/08 , G10L2015/081
Abstract: PURPOSE: A search space generating method for voice recognition and a system thereof are provided to improve an accuracy of a voice recognition by adding 'a pronunciation heat which is generated by a pronunciation conversion between recognition units' to a search space. CONSTITUTION: A WFST[Weighted Finite State Transducer] coupling unit generates a WFST L·G by a coupling of a WFST G[WFST Grammar] and a WFST L[WFST pronunciation Library] and generates a WFST L'·L·G by a coupling of a WFST L'[WFST pronunciation conversion] and the WFST L·G(310,320). The WFST coupling unit generates a WFST C·L'·L·G by a coupling of a WFST context[WFST C] and the WFST L'·L·G and generates a WFST H·C·L'·L·G by a coupling of a WFST H[WFST Hidden Markov model] and the WFST C·L'·L·G(330,340). A WFST optimization unit optimizes the WFST H·C·L'·L·G(350). [Reference numerals] (310) WFST G and WFST L combination; (320) WFST L' and WFST L·G combination; (330) WFST C and WFST L'·L·G combination; (340) WFST H and WFST C·L'·L·G combination; (350) Optimization; (AA) Start; (BB) End
Abstract translation: 目的:提供一种用于语音识别的搜索空间生成方法及其系统,以通过将由识别单元之间的语音转换产生的发音热量添加到搜索空间来提高语音识别的精度。 构成:WFST [加权有限状态传感器]耦合单元通过WFST G [WFST语法]和WFST L [WFST发音库]的耦合产生WFST L·G,并通过一个WFST L'·L·G生成WFST L' WFST L'[WFST发音转换]与WFST L·G(310,320)的耦合。 WFST耦合单元通过WFST上下文[WFST C]和WFST L'·L·G的耦合产生WFST C·L'·L·G,并通过下式产生WFST H·C·L'·L·G WFST H [WFST隐马尔可夫模型]和WFST C·L'·L·G(330,340)的耦合。 WFST优化单元优化WFST H·C·L'·L·G(350)。 (参考号)(310)WFST G和WFST L组合; (320)WFST L'和WFST L·G组合; (330)WFST C和WFST L'·L·G组合; (340)WFST H和WFST C·L'·L·G组合; (350)优化; (AA)开始; (BB)结束
-
公开(公告)号:KR1020120056086A
公开(公告)日:2012-06-01
申请号:KR1020100117611
申请日:2010-11-24
Applicant: 한국전자통신연구원
CPC classification number: G10L15/14 , G10L15/26 , G10L19/038
Abstract: PURPOSE: An acoustic model adapting method and a voice recognizing device using the same are provided to eliminate a re-study burden of a user about a quantized acoustic model by an embedded voice recognizing machine. CONSTITUTION: An extracting unit(110) extracts features from a waveform corresponding to a voice. The extracting unit generates quantized data. A probability measuring unit(120) applies the quantized data, an adapted network, and a quantized acoustic model to fixed point-applied high-speed computation. The probability measuring unit calculates Gaussian occupancy probability. An adaption unit(130) updates the acoustic model. A voice recognizing unit(150) recognizes the extracted features using the updated acoustic model.
Abstract translation: 目的:提供一种声学模型适应方法和使用其的语音识别装置,以消除用户通过嵌入式语音识别机器对量化声学模型的重新学习负担。 构成:提取单元(110)从对应于声音的波形中提取特征。 提取单元生成量化数据。 概率测量单元(120)将量化数据,适应网络和量化声学模型应用于固定点施加的高速计算。 概率测量单元计算高斯占用概率。 适应单元(130)更新声学模型。 语音识别单元(150)使用更新的声学模型识别所提取的特征。
-
公开(公告)号:KR100248401B1
公开(公告)日:2000-04-01
申请号:KR1019970055651
申请日:1997-10-28
Applicant: 한국전자통신연구원
IPC: B64C13/18
Abstract: 본 발명은 헬리콥터 조종 메타포어를 이용한 가상공간 탐색 방법에 관한 것으로서, 본 발명에서 제공하는 방법은 3차원 가상 공간의 영상을 가상 카메라의 시각으로 탐색하는 방법에 있어서, 상기 가상 카메라의 움직임을 조이스틱에 의해서 헬리콥터 조종사 메타포어 방식으로 조정할 수 있도록 인터페이스 시키고, 상기 탐색이 이루어지는 메인 영상 화면의 하단부에 상기 조이스틱에 의해 2차원의 운동을 조절할 수 있는 가상 헬리콥터를 표시하는 6개의 보조 윈도우를 표시하며, 상기 6개의 보조 윈도우는 각각 수평/수직의 이동, 선회, 수직/수평면의 회전 및 임의의 중심점에 대한 회전에 대해 2차원의 운동을 표시하는 운동평면과 그 운동평면에서 이동되는 가상 헬리콥터를 표시하고, 상기 조이스틱에 의해 상기 6개의 보조 윈도우를 선택하여 각 윈 도우내의 가상 헬리콥터를 2차원 운동시켜 3차원 가상공간의 영상을 탐색하도록 하여, 일반 비행기에서 보다 움직임이 자유롭고, 사용자는 헬리콥터의 운동에 대해서 익히 알고 있지 때문에 언제 어떤 조작을 하는 것이 좋은지를 잘 알 수 있으므로, 훨씬 용이하게 가상공간을 탐색할 수 있다.
-
公开(公告)号:KR100248374B1
公开(公告)日:2000-03-15
申请号:KR1019970062775
申请日:1997-11-25
Applicant: 한국전자통신연구원
IPC: H04N5/262
Abstract: 본 발명은 증강현실 시스템에서 카메라와 트래커간의 불일치에 의해 발생되는 중첩 오차를 보정하는 방법에 관한 것으로, 사용자가 모니터를 보면서 실세계와 가상객체간의 대응하는 임의의 특징점들을 선정하고, 선정된 특징점들을 이용하여 카메라 위치와 자세를 구하기 위하여 최적화알고리즘인 유전자 알고리즘을 적용한다. 유전자알고리즘에서 구해진 카메라 위치 및 자세 데이터와 이미 알고 있는 트래커의 위치 및 자세 데이타간의 차이를 나타내는 보정행렬을 구하고, 실제 동적환경에서 운용시 트래커에서 구해진 위치와 자세를 상기 보정행렬을 이용하여 보정하여 실세계와 가상객체를 정확히 중첩할 수 있다. 또한 카메라와 트래커를 대충 부착하여도 카메라와 트랙커간의 차이를 구할 수 있어, 증강현실 응용시스템에서 카메라와 트래커간의 정적오차를 줄이는데 필수적인 방법이다.
-
公开(公告)号:KR100238426B1
公开(公告)日:2000-01-15
申请号:KR1019970062788
申请日:1997-11-25
IPC: H04Q11/00
Abstract: 본 발명은 도 1과 같이 입력 PCM 링크 In으로 들어오는 PCM 채널 M
1 , M
2 , ... , M
i 들이 출력 PCM 링크 Out의 임의의 타임 슬롯(T
1 ,T
2 ,...,T
o )으로 위치 바꿈 하여 나타날 수 있게 하는 종래의 타임슬롯 스위치의 개념을 확장한다.
즉, 도 2와 같이, 채널수가 r이고, 채널 데이타가 m 비트의 링크에 병렬로 분산 및 시분할 다중화되어 있는 경우에, 채널 데이타의 타임슬롯 위치를 변경할 수 있도록 하는 병렬 타임슬롯 교환에 관한 것으로, 특히, 고속의 채널 데이타의 교환에 효과적인 공간 분할 스위치를 병렬로 사용하여 타임슬롯 교환 기능을 구현하였다.-
公开(公告)号:KR100231712B1
公开(公告)日:1999-11-15
申请号:KR1019970024562
申请日:1997-06-13
Applicant: 한국전자통신연구원
IPC: G06Q50/00
Abstract: 본 발명은 무인 정찰기 시스템의 운용방법에 관한 것으로서, 특히, 가상 현실을 이용하여 실세계 정보를 보강하는 기술인 증강 현실 기술을 이용하여 무인 정찰기 시스템을 운용하는 방법에 관한 것이다.
무인정찰기 시스템을 운용하는 방법은, 정찰 대상의 실사 이미지를 얻기 위해 정찰 대상을 촬영하여 정찰 대상에 대한 정보를 수집하고 가상 이미지를 생성하기 위해 컴퓨터 그래픽스 기술 및 가시화 방법을 이용하여 필요한 정보를 가시화 하는 제 1 과정과, GPS와 CCD 카메라를 이용하여 정찰 대상의 절대 위치와 실사이미지를 얻어 상기 제 1 과정에서 생성된 가상 이미지와 실사 이미지를 합성하는 제 2 과정과, 사용자 인터페이스를 통해 상기 무인 정찰기 시스템의 이동에 따라 변하는 실사 이미지와 가상 이미지를 동기화 하는 제 3 과정으로 구성되어, 정보를 효율적으로 이용할 수 있으며, 정보 획득을 용이하게 함으로서 정보 이용을 높일 수가 있다.-
公开(公告)号:KR1019990054791A
公开(公告)日:1999-07-15
申请号:KR1019970074666
申请日:1997-12-26
Applicant: 한국전자통신연구원
IPC: G09B9/08
Abstract: 본 발명은 가상현실 기술을 이용한 무선조종 모형 항공기 시뮬레이션 시스템에 관한 것으로서, 대형 항공기 시뮬레이션과는 달리 휴대형으로 몸에 부착한 후, 임의의 장소에서 모형 항공기의 조종을 훈련할 수 있는 시스템에 관한 것이다. 그 목적은 사용자가 조종하는 대로 움직이는 모형 항공기 모델을 실시간에 시뮬레이션하고 사용자의 눈에 가시화시키는 무선조종 모형 항공기 시뮬레이션 시스템을 제공하는 데에 있다. 그 특징은 다양한 모형 항공기 모델을 컴퓨터 시스템에 수록하는 단계와, 무선 조종기로부터 받은 신호를 처리하여 모형 항공기 모델을 시뮬레이션 하는 단계 및 시뮬레이션 단계의 신호처리 결과를 렌더링하는 단계로 이루어지는 데에 있다. 그 효과는 훈련생이 장소의 특이성이나 장비의 파손 위험이 없어 수많은 시행착오를 피하고 단기간에 많은 경험을 쌓을 수 있다는 데에 그 효과가 있다.
-
-
-
-
-
-
-
-
-