-
公开(公告)号:KR101294024B1
公开(公告)日:2013-08-08
申请号:KR1020090127336
申请日:2009-12-18
Applicant: 한국전자통신연구원
Abstract: 본 발명은 전자책 시스템을 위한 인터랙티브 컨텐츠를 제작, 유통, 활용하는 장치 및 방법에 관한 것이다.
본 발명은, 컨텐츠 제공 장치에 있어서, 컨텐츠 저작 도구 및 컨텐츠 구성 아이템을 유통시키는 저작 도구 유통부; 상기 저작 도구 유통부로부터의 컨텐츠 저작 도구 및 컨텐츠 구성 아이템을 이용하거나 기 제작된 컨텐츠를 더 이용하여 인터랙티브 컨텐츠를 생성하는 인터랙티브 컨텐츠 제작부; 및 상기 인터랙티브 컨텐츠 제작부에서 생성된 인터랙티브 컨텐츠를 단말로 유통시키거나 타 인터랙티브 컨텐츠 제작부로 더 유통시키는 인터랙티브 컨텐츠 유통부를 포함하되, 상기 인터랙티브 컨텐츠는, 스크립트, 객체 데이터, 장면 데이터를 포함한다.
전자책, e-book, 음성인식, 음성합성, 인터랙티브 동화, 아동, 유아-
公开(公告)号:KR101217525B1
公开(公告)日:2013-01-18
申请号:KR1020080131365
申请日:2008-12-22
Applicant: 한국전자통신연구원
CPC classification number: G10L15/08 , G10L15/142
Abstract: 본 발명에 따른 비터비 디코더는, 입력된 음성 프레임의 관측 벡터에 대한 관측 확률 값을 계산하고, 과거 음성 프레임에 대해 계산된 관측 확률값과의 비션형 필터링을 통해 현재 관측 확률값을 갱신하고, 이를 기반으로 최대 유사도 값을 산출하여 인식 단어를 출력한다.
이와 같이, 본 발명은 관측 확률에 대한 비선형 필터링 방식을 적용하여 음성 신호간에 존재하는 상관성을 토대로 관측 확률 값을 복원함으로써, 의도하지 않은 임펄스성 잡음으로 인해 오염된 부분의 관측 확률이 급격히 낮아지는 것을 방지할 수 있다.
비터비 디코더, 음성, 관측 확률, 비선형 필터링, 잡음-
公开(公告)号:KR101082837B1
公开(公告)日:2011-11-11
申请号:KR1020080131243
申请日:2008-12-22
Applicant: 한국전자통신연구원
IPC: G10L21/0208 , G10L15/20
Abstract: 본발명은잡음제거장치및 방법에관한것으로, 잡음변화가심한환경과여러가지의잡음이혼재하는환경에서잡음제거효율을향상하기위해, 소프트마스킹기법등과같은음성/잡음분리기법을통해음성과잡음의분리기능을강화하고, 잡음가우시안혼합모델이입력신호에대한잡음성분을모델링하는데한계가있는점을보완하기위해잡음적응기법을사용함으로써, 깨끗한음성을보다정확히추정하여음성인식성능을높이는이점이있다.
-
74.
公开(公告)号:KR101064948B1
公开(公告)日:2011-09-16
申请号:KR1020080125435
申请日:2008-12-10
Applicant: 한국전자통신연구원
IPC: H04L12/28
Abstract: 본 발명은 URC(Ubiquitious Robotic Companion) 단말(로봇)을 이용하여 가정 내에서 사용자의 위치와 관계없이 가정 내에 분산된 음악, 영화, 방송, 게임, 개인 미디어 등의 다양한 멀티미디어 컨텐츠를 즐길 수 있도록 지원하는 홈 엔터테인먼트(Home Entertainment) 로봇 서비스에 관한 것이다. 무선 통신을 통해 연결된 URC 단말 및 서버가 홈 네트워크에 연결된 다양한 멀티미디어 기기와 컨텐츠를 통합 관리하고, 이동과 음성입력이 가능한 로봇이 음성호출 기능 및 위치센서를 통해 사용자의 인접거리에서 서비스를 제공함으로써 음성입력을 위해 리모콘을 사용하거나 가정 내에 마이크가 분산 배치될 필요성이 없다. 또한, 가정내의 좌표 정보를 활용해서 로봇과 인접에 있는 사용자의 위치에 맞는 서비스를 제공할 수 있는 것을 특징으로 한다.
음성인식, 음성합성, URC, 홈 네트워크, 멀티미디어 컨텐츠, 멀티미디어 기기, 홈 엔터테인먼트, 정보검색-
公开(公告)号:KR1020110066628A
公开(公告)日:2011-06-17
申请号:KR1020090123360
申请日:2009-12-11
Applicant: 한국전자통신연구원
CPC classification number: H04M1/23 , G06K9/00335 , G10L15/26 , H04M2250/52
Abstract: PURPOSE: An apparatus for inputting a text using a lip reading method in a mobile phone and a method thereof are provided to input a character by recognizing the motion of a user's mouth. CONSTITUTION: A face location tracking unit(210) detects the motion of a user in a photographing device. A lip motion feature detecting unit(220) extracts a specific vector about an area including the lip shape from the face image by the face location tracking unit. A lip motion extracting unit(230) extracts a feature vector by the movement of the lip among the extracted vectors. A lip motion decoding unit(260) changes the feature vector from the lips motion extracting unit into a corresponding character.
Abstract translation: 目的:提供一种用于在移动电话中使用唇读取方法输入文本的装置及其方法,用于通过识别用户嘴的运动来输入字符。 构成:面部位置跟踪单元(210)检测拍摄装置中的用户的运动。 唇部运动特征检测单元(220)通过面部位置跟踪单元从脸部图像提取关于包括唇部形状的区域的特定矢量。 唇部运动提取单元(230)通过所提取的矢量中的唇部的移动来提取特征向量。 唇部运动解码单元(260)将特征矢量从嘴唇运动提取单元改变成相应的字符。
-
公开(公告)号:KR1020110027362A
公开(公告)日:2011-03-16
申请号:KR1020090085423
申请日:2009-09-10
Applicant: 한국전자통신연구원
CPC classification number: H04N21/440236 , G10L21/0216 , H04N21/42684 , H04N21/4621
Abstract: PURPOSE: An IPTV system and a service method using a voice interface are provided to obtain voice recognition performance improvement and service performance improvement using voice characteristic and preference information of a user individual by using a voice interface. CONSTITUTION: A voice input device(110) receives an input of a voice of a user. A voice process device(120) converts a voice into a text after receiving a voice inputted from the voice input device and performing a voice recognition. A query process and a content research device(150) extracts a query word by receiving converted text and search content by query into a keyword. A content supply device(160) provides searched content to a user.
Abstract translation: 目的:提供使用语音接口的IPTV系统和服务方法,以通过使用语音接口的语音特征和用户个人的偏好信息来获得语音识别性能改进和服务性能改进。 构成:语音输入装置(110)接收用户的语音输入。 语音处理设备(120)在接收到从语音输入设备输入的语音并执行语音识别之后,将语音转换为文本。 查询处理和内容研究装置(150)通过接收转换的文本并通过查询搜索内容到关键字中来提取查询词。 内容供应装置(160)向用户提供搜索到的内容。
-
公开(公告)号:KR101005786B1
公开(公告)日:2011-01-06
申请号:KR1020080125434
申请日:2008-12-10
Applicant: 한국전자통신연구원
Abstract: 본 발명은 차량용 네비게이션 단말기의 음성인식용 발화 이형태 생성을 위한 POI(points of interest) 대상, 복합명사 분해 및 태깅(tagging) 방법을 제시한다. 소형 차량 네비게이션 단말기 탑재 음성 인식 엔진은 일반적으로 고립어를 인식 대상으로 한다. 고립어는 지도상의 특정 지점에 대한 명칭이며, 이러한 명칭에 대해 사용자는 다양한 발화 이형태를 가진다. 본 발명은 사용자의 다양한 발화 이형태 생성을 위해, 지역 명칭으로 기술된 복합명사 형태의 어휘를 대상으로 복합 명사 분해 및 태깅 방법론을 제시한다. 분해는 차트 기반 동적 프로그래밍 방법론을 기반으로 하고, 태깅은 최대 엔트로피를 기반으로 하여 POI명칭을 구성하는 단일어 각각에 대한 의미 표지를 부착한다.
복합명사, 복합명사분해, 태깅, POI, 이형태-
公开(公告)号:KR1020100073178A
公开(公告)日:2010-07-01
申请号:KR1020080131772
申请日:2008-12-22
Applicant: 한국전자통신연구원
IPC: G10L15/06 , G08G1/0968 , G10L15/14
Abstract: PURPOSE: A speaker adaptation apparatus and a method for speech recognition are provided to remarkably improve the performance of a speaker by estimating the answer of actual speech data in high possibility through an N-best recognition result screen output function. CONSTITUTION: A voice data verification unit(202) obtains measurement data for each phoneme with regard to accumulation data through reliability evaluation. The accumulation data includes voice data and N-best recognition result data. A sound model speaker adapting unit(204) performs speaker adaptation by measurement data for each acquired per-phoneme. A sound model updating unit(206) updates a sound model by a new speaker-subordinate sound model through performed speaker adaptation.
Abstract translation: 目的:提供一种扬声器适配装置和语音识别方法,以通过N最佳识别结果屏幕输出功能估计高可能性的实际语音数据的答案来显着提高扬声器的性能。 构成:语音数据验证部(202)通过可靠性评价获取关于累积数据的每个音素的测量数据。 累积数据包括语音数据和N最佳识别结果数据。 声音扬声器适配单元(204)通过每个获取的每个音素的测量数据执行说话者适应。 声音模型更新单元(206)通过执行的说话者自适应通过新的说话者 - 从属声音模型来更新声音模型。
-
公开(公告)号:KR1020100072747A
公开(公告)日:2010-07-01
申请号:KR1020080131239
申请日:2008-12-22
Applicant: 한국전자통신연구원
Abstract: PURPOSE: A method for environment adaptation using discrimination training based on channel estimation is provided to find channel characteristic about adaptation data maintaining discrimination primarily and perform model conversion and combine converted model with discrimination learning technique thereby providing effective environmental adaptation. CONSTITUTION: A noise removing unit(110) eliminates noise component within training data(101). A base recognition performing unit(130) recognizes adaptive data(103). A channel characteristic estimator obtains statistical model about phoneme unit by right data(104) of the adaptation data. The channel characteristic estimator combines the statistical model to base sound model(102). A discrimination environment adapting unit(150) outputs adaptive sound model(106) after change of the statistical model by adaptation of discrimination learning technique.
Abstract translation: 目的:提出一种使用基于信道估计的鉴别训练进行环境适应的方法,主要查找关于自适应数据维持鉴别的信道特性,并执行模型转换,并将转换模型与识别学习技术相结合,从而提供有效的环境适应。 构成:噪声去除单元(110)消除训练数据(101)内的噪声分量。 基本识别执行单元(130)识别自适应数据(103)。 信道特征估计器通过适配数据的正确数据(104)获得关于音素单元的统计模型。 信道特征估计器将统计模型与基础声音模型(102)相结合。 鉴别环境适应单元(150)在通过识别学习技术的适应改变统计模型之后输出自适应声音模型(106)。
-
公开(公告)号:KR1020100072744A
公开(公告)日:2010-07-01
申请号:KR1020080131236
申请日:2008-12-22
Applicant: 한국전자통신연구원
IPC: H04N21/422 , G06F3/16 , G10L15/28
CPC classification number: H04N21/42212 , G06F3/16 , G10L15/28
Abstract: PURPOSE: A remote controller, a method and an apparatus for controlling an input interface are provided to enable a user to conveniently input a Hangul, English, number and symbol character through a keypad. CONSTITUTION: An input keypad(1100) combines two keys among a number key, an asteroid key, a sharp key, a directional key and a special character key. The input keypad selects one of input among the Hangul, English and number characters and symbol, and a control unit(1200) recognizes a key operation through the input keypad. The control unit process a key signal corresponding to the recognized key operation, and a wireless transmission unit(1400) transmits the key signal processed in the control unit.
Abstract translation: 目的:提供用于控制输入接口的遥控器,方法和装置,以使用户能够通过键盘方便地输入韩文,英文,数字和符号字符。 构成:输入键盘(1100)组合数字键,小行星键,锐利键,方向键和特殊字符键中的两个键。 输入键盘选择韩文,英文和数字字符和符号中的一个输入,控制单元(1200)通过输入键盘识别键操作。 控制单元处理与所识别的键操作对应的键信号,无线发送单元(1400)发送在控制单元中处理的键信号。
-
-
-
-
-
-
-
-
-