-
公开(公告)号:KR101578766B1
公开(公告)日:2015-12-22
申请号:KR1020110090283
申请日:2011-09-06
Applicant: 한국전자통신연구원
IPC: G10L15/08
Abstract: 본발명은선택적포즈가삽입될단어목록을기반으로요소 WFST를구성함으로써, 음성인식의성능을떨어뜨리지않으면서탐색공간의크기증가를최소화할수 있는음성인식용탐색공간생성장치및 방법에관한것이다.이를위하여본 발명은발음사전과, 선택적포즈가삽입될단어목록을저장하고있는단어목록데이터베이스와, 상기발음사전으로부터읽어들인각 단어의발음열을이용하여탐색공간을생성하되, 상기읽어드린단어가상기단어목록데이터베이스에포함된경우상기읽어드린단어에선택적포즈를삽입시켜탐색공간을생성하는탐색공간구현부와, 상기선택적포즈가삽입된탐색공간이저장된데이터베이스를포함하는음성인식용탐색공간생성장치를제공한다.
-
公开(公告)号:KR1020140082157A
公开(公告)日:2014-07-02
申请号:KR1020120151688
申请日:2012-12-24
Applicant: 한국전자통신연구원
Inventor: 김동현
IPC: G10L15/14
CPC classification number: G10L15/32 , G10L15/065
Abstract: Disclosed are a device and a method for speech recognition using multiple acoustic models. The device for speech recognition using multiple acoustic models according to the present invention comprises a speech data database (DB) to store speech data collected in various noise environments; a model generation means to classify the collected speech data according to speaker and environment and generate an acoustic model of a binary tree structure as a result of the classification; and a speech recognition means to extract feature data of the input speech data when the speech data is input from a user, select multiple models from the previously generated acoustic model based on the extracted feature data, recognize the speech data in parallel based on the selected multiple models, and output a word sequence corresponding to the speech data as a result of the recognition.
Abstract translation: 公开了一种使用多种声学模型进行语音识别的装置和方法。 根据本发明的使用多个声学模型的用于语音识别的装置包括:语音数据数据库(DB),用于存储收集在各种噪声环境中的语音数据; 模型生成装置,用于根据说话者和环境对所收集的语音数据进行分类,并作为分类的结果生成二叉树结构的声学模型; 以及语音识别装置,用于当从用户输入语音数据时提取输入语音数据的特征数据,基于所提取的特征数据从先前生成的声学模型中选择多个模型,基于所选择的并行识别语音数据 作为识别的结果,输出与语音数据对应的单词序列。
-
公开(公告)号:KR1020130026855A
公开(公告)日:2013-03-14
申请号:KR1020110090283
申请日:2011-09-06
Applicant: 한국전자통신연구원
IPC: G10L15/08
Abstract: PURPOSE: A search space generator for recognizing voice is provided to improve the accuracy of voice recognition by recognizing the voice by using a voice articulation database for training a voice model. CONSTITUTION: A search space generator for recognizing voice includes a pronunciation dictionary(100), a word list database(120), a WFST(Weighted Finite State Transducer) L realization unit(140), and a WFST L database(160). The WFST L implementation unit acquires a pronunciation string for each word by reading the pronunciation dictionary. The WFST L implementation unit generates WFST L in which a selective pause is inserted by comparing the acquired pronunciation dictionary with the word list stored in the word list database. [Reference numerals] (100) Pronunciation dictionary; (120) Word list database; (140) WFST L realization unit; (160) WFST L database
Abstract translation: 目的:提供用于识别语音的搜索空间发生器,以通过使用用于训练语音模型的语音发音数据库识别语音来提高语音识别的准确性。 构成:用于识别语音的搜索空间发生器包括发音字典(100),单词列表数据库(120),WFST(加权有限状态传感器)L实现单元(140)和WFST L数据库(160)。 WFST L实现单元通过读取发音字典获取每个单词的发音字符串。 WFST L实现单元产生WFST L,其中通过将获取的发音字典与存储在单词列表数据库中的单词列表进行比较来插入选择性暂停。 (附图标记)(100)发音字典; (120)词汇表数据库; (140)WFST L实现单元; (160)WFST L数据库
-
54.
公开(公告)号:KR1020130026847A
公开(公告)日:2013-03-14
申请号:KR1020110090273
申请日:2011-09-06
Applicant: 한국전자통신연구원
Inventor: 김동현
IPC: G10L15/14
Abstract: PURPOSE: A voice recognition system using an online unsupervised characteristic vector adaptation method and a method thereof are provided to offer a recognition performance by using conversion parameters which convert the characteristic vector of voice data. CONSTITUTION: A voice recognition system extracts a characteristic vector from inputted voice data(410). The voice recognition system selects a GMM(Gaussian Mixture Model) which is close to the characteristic vector through a tress search method(430). The voice recognition system calculates conversion parameters by using the selected GMM(440). The voice recognition system converts the characteristic vector by using the calculated conversion parameters(450). The voice recognition system recognizes the voice of a user(460). [Reference numerals] (410) Extracting a characteristic vector from voice data; (420) Selecting the characteristic vector as much as a window size; (430) Selecting the most similar GMM through tree searching; (440) Measuring conversion parameters; (450) Converting the characteristic vector using the conversion parameters; (460) Recognizing the voice of a user; (AA) Start; (BB) End
Abstract translation: 目的:提供使用在线无监督特征向量自适应方法及其方法的语音识别系统,通过使用转换语音数据的特征向量的转换参数来提供识别性能。 构成:语音识别系统从输入的语音数据(410)中提取特征矢量。 语音识别系统通过发声搜索方法(430)选择接近特征向量的GMM(高斯混合模型)。 语音识别系统通过使用所选择的GMM(440)来计算转换参数。 语音识别系统通过使用计算的转换参数(450)来转换特征向量。 语音识别系统识别用户的语音(460)。 (附图标记)(410)从语音数据提取特征向量; (420)选择特征向量尽可能多的窗口大小; (430)通过树形搜索选择最相似的GMM; (440)测量转换参数; (450)使用转换参数转换特征向量; (460)识别用户的声音; (AA)开始; (BB)结束
-
公开(公告)号:KR101134682B1
公开(公告)日:2012-04-09
申请号:KR1020090056120
申请日:2009-06-23
Applicant: 한국전자통신연구원
Abstract: PURPOSE: A speaker adaptation system and a method thereof are provided to utilize the cumulative variable for obtaining enough statistics for the non-instruction adaptation in voice recognitioin process without performing an adaptation training thereby enabling to gradual adaptation. CONSTITUTION: A characteristic detecting part(110) extracts an eigenvector from a voice signal. A sound model storage(120) stores an acoustic model consisting of a recursive tree. A conversion parameter class determiner(130) produces gaussian posteriori probability of a candidate state based on the eigenvector and the sound model and determines the cumulative variable and a conversion parameter class based on the gaussian posterior probability. A sound model updater(140) produces the conversion parameter based on the conversion parameter class and cumulative variable and renews the acoustic model.
-
公开(公告)号:KR1020120019011A
公开(公告)日:2012-03-06
申请号:KR1020100082078
申请日:2010-08-24
Applicant: 한국전자통신연구원
Abstract: PURPOSE: An interaction service providing device using user information combination is provided to enable a user to analyze a state and to improve the quality of a service. CONSTITUTION: A condition determining unit(130) combines inputted personal information of a user and received personal information of the other user. The condition determining unit analyzes a condition o the user and the other user based on the combined information. A service adjusting unit(140) adjusts support service information.
Abstract translation: 目的:提供使用用户信息组合的交互服务提供设备,以使用户能够分析状态并提高服务质量。 条件:条件确定单元(130)组合输入的用户的个人信息和所接收的另一用户的个人信息。 条件确定单元基于组合的信息分析用户和其他用户的条件。 服务调整单元(140)调整支持服务信息。
-
公开(公告)号:KR1020110133857A
公开(公告)日:2011-12-14
申请号:KR1020100053500
申请日:2010-06-07
Applicant: 한국전자통신연구원 , 부산대학교 산학협력단
CPC classification number: H04N21/26606 , H04H2201/11
Abstract: PURPOSE: A method for transmission of conditional access message for a terrestrial DMB is provided to reduce transmission capacitance of conditional access message. CONSTITUTION: A resource collector collects resources of vacant FIB(Fast information Block) and an MSC(Main Service Channel) domain among not used resources which are not used in each sub channel. The resource collector multiplexes the collected resource pieces(S110). The resource collector creates a conditional access message(S130). The resource collector transmits the conditional access message(S140). If the message transmission is completed, the resource collector completes the transmission of the conditional access message(S150,S160).
Abstract translation: 目的:提供一种用于传输地面DMB的条件访问消息的方法,以减少条件访问消息的传输电容。 规定:资源收集者在每个子频道中未使用的未使用资源中收集空闲FIB(快速信息块)和MSC(主服务信道)域的资源。 资源收集器复用所收集的资源块(S110)。 资源收集器创建条件访问消息(S130)。 资源收集器发送条件访问消息(S140)。 如果消息发送完成,则资源收集器完成条件访问消息的发送(S150,S160)。
-
公开(公告)号:KR100249824B1
公开(公告)日:2000-03-15
申请号:KR1019970067907
申请日:1997-12-11
Applicant: 한국전자통신연구원
IPC: G06F11/30
Abstract: 본 발명은 가상 현실을 이용하여 구성된 3차원 가상 공간의 네비게이션을 좀 더 효율적으로 하기 위한 3차원 가상 공간 탐색 시스템 및 방법에 관한 것이다.
기존의 3차원 가상 공간 네비게이션은 2차원 입력 장치를 이용하여 3차원 가상 공간을 네비게이션 하는 방법이 대부분이었고, 3차원 입력 장치를 이용하는 경우에도 3차원 입력 장치가 네비게이션에는 적합하지 않았다. 본 발명은 3차원 가상 공간 네비게이션을 효율적으로 하기 위한 하드웨어와 소프트웨어를 개발하여 3차원 가상 공간에서의 정보이용을 높일 수 있다.-
公开(公告)号:KR100226449B1
公开(公告)日:1999-10-15
申请号:KR1019960066274
申请日:1996-12-16
IPC: H04L12/43
Abstract: 본 발명은 STM-N 동기식 광전송 시스템의 수신국에서 전송 오류 상태를 송신국으로 전달하기 위한 M1바이트 전달회로에 관한 것으로서, 종래의 M1바이트 처리기술은 미비하고 다중화기와 역다중화 기간의 M1바이트 전송시 M1바이트가 정상적으로 전달되었는지 판단하는 방식이 제안되지 않은 문제가 있으므로 상기 문제를 해결하기 위해 본 발명은, 수신국의 다중화기에서 검출된 BIP를 근거로 생성한 M1바이트를 직렬신호로서 다중화기로 전달 및 M1바이트 전달시 발생가능한 오류를 검출하는 방식을 제공하여 오류검출을 위해 역다중화기에서 8비트로 부호화된 M1바이트만을 다중화기로 전달하면 다중화기에서 수신된 M1바이트를 병렬 로딩한 후 다시 2진 합산하여 역다중화기에서 보내온 짝수 패리티비트와 비교하여 역다중화기와 다중화기간의 M1바이트 � ��송시 오류 발생을 검출하고 검출된 오류는 성능평가에 활용함으로써 SRM-N 시스템 적용을 통해 M1바이트 전달시 발생할 수 있는 전송오류를 평가할 수 있고 서로 다른 클럭소스를 사용하는 역다중화기와 다중화기간의 신호전송을 정상적으로 할 수 있는 회로를 제공함으로써 광전송 시스템의 구축을 용이하게 할 수 있으며 STM-N 신호에 모두 공통적으로 적용이 가능한 효과를 가진다.
-
公开(公告)号:KR1019990042072A
公开(公告)日:1999-06-15
申请号:KR1019970062775
申请日:1997-11-25
Applicant: 한국전자통신연구원
IPC: H04N5/262
Abstract: 본 발명은 증강현실 시스템에서 카메라와 트래커간의 불일치에 의해 발생되는 중첩 오차를 보정하는 방법에 관한 것으로, 사용자가 모니터를 보면서 실세계와 가상객체간의 대응하는 임의의 특징점들을 선정하고, 선정된 특징점들을 이용하여 카메라 위치와 자세를 구하기 위하여 최적화알고리즘인 유전자 알고리즘을 적용한다. 유전자알고리즘에서 구해진 카메라 위치 및 자세 데이터와 이미 알고 있는 트래커의 위치 및 자세 데이타간의 차이를 나타내는 보정행렬을 구하고, 실제 동적환경에서 운용시 트래커에서 구해진 위치와 자세를 상기 보정행렬을 이용하여 보정하여 실세계와 가상객체를 정확히 중첩할 수 있다. 또한 카메라와 트래커를 대충 부착하여도 카메라와 트랙커간의 차이를 구할 수 있어, 증강현실 응용시스템에서 카메라와 트래커간의 정적오차를 줄이는데 필수적인 방법이다.
-
-
-
-
-
-
-
-
-