-
11.
公开(公告)号:KR100615522B1
公开(公告)日:2006-08-25
申请号:KR1020050011668
申请日:2005-02-11
Applicant: 한국정보통신대학교 산학협력단 , 한국전자통신연구원
IPC: G06F17/00
Abstract: 본 발명은 음악 컨텐츠 분류 방법 그리고 이를 이용한 음악 컨텐츠 제공 시스템 및 그 방법에 관한 것이다.
본 발명에서는 음악 컨텐츠들을 클래식, 팝, 블루스, 가곡 등 일반적인 음악적 카테고리에 따라 분류하는 것이 아니고, 음악 컨텐츠간의 유사도를 표현하는 보다 근본적인 방법으로 음악 컨텐츠를 음색(Timbre), 리듬(Rhythm), 무드(Mood) 등으로 분류한다. 그리고 이와 같이 분류된 음악 컨텐츠를 토대로 하여 사용자가 요청한 음악 컨텐츠뿐만 아니라 비슷한 음악적 특징을 가진 음악 컨텐츠들도 함께 제공한다.
이러한 본 발명에 따르면 사용자에게 음악 컨텐츠를 다양하게 제공할 수 있으며, 또한 신뢰성을 가진 유사 음악 컨텐츠를 제공할 수 있다.
음악컨텐츠, 내용기반 음악검색, 유사음악, 유사도, 특징벡터, 벡터양자화-
公开(公告)号:KR1020010076789A
公开(公告)日:2001-08-16
申请号:KR1020000004144
申请日:2000-01-28
Applicant: 한국전자통신연구원
IPC: G06F3/16
Abstract: PURPOSE: A multi-modal Internet interface device and a method thereof are provided to dialogue to a computer by a voice and to perform a web browsing by appending a voice interface function in a currently used web browser. CONSTITUTION: An MXML editor(312) makes a user prepare an MXML document using a template library by operations(311). A multi-modal Internet server(310) stores a prepared MXML document and includes an MXML document server providing the MXML document in accordance with the user. An MXML browser(321) is connected to the multi-modal Internet server(310) through the Internet, and interprets the MXML document and showing the contents of the MXML document on a screen and outputs a voice compounding message and prepares a voice recognition engine. A voice/compounding engine(322) performs voice recognition or a voice compounding. A TAPI(telephony application programming interface)(325)/MTAPI(multimedia telephony application programming interface)(326) provides an interface in an access to a multi-modal Internet client using a telephone(330). An I/O(input/output) device(324) comprises a keyboard, a mouse, a monitor, a mike, and a speaker. An I/O interface(323) provides an interface among the TAPI(325), the MTAPI(326), and the MXML browser(321).
Abstract translation: 目的:提供多模式互联网接口设备及其方法,以通过语音与计算机对话,并通过在当前使用的web浏览器中附加语音接口功能来执行网页浏览。 构成:MXML编辑器(312)使用户使用模板库(311)准备一个MXML文档。 多模式互联网服务器(310)存储准备的MXML文档,并且包括根据用户提供MXML文档的MXML文档服务器。 MXML浏览器(321)通过互联网连接到多模式互联网服务器(310),并解释MXML文档并在屏幕上显示MXML文档的内容,并输出语音复合消息并准备语音识别引擎 。 语音/复合引擎(322)执行语音识别或语音复合。 TAPI(电话应用编程接口)(325)/ MTAPI(多媒体电话应用编程接口)(326)提供使用电话(330)访问多模式因特网客户端的接口。 I / O(输入/输出)装置(324)包括键盘,鼠标,监视器,麦克风和扬声器。 I / O接口(323)提供TAPI(325),MTAPI(326)和MXML浏览器(321)之间的接口。
-
公开(公告)号:KR100212448B1
公开(公告)日:1999-08-02
申请号:KR1019960027221
申请日:1996-07-05
Applicant: 한국전자통신연구원
Inventor: 김회린
IPC: G06F17/20
Abstract: 본 발명은 사람과 컴퓨터 사이의 인터페이스에서 음성 인식 방법을 사용할 때, 컴퓨터가 인식할 수 있는 명령어 집합이나 정보 검색 기능 어휘에 제한을 두지 않되, 매 순간 인식 대상이 될 명령어나 어휘의 집합을 그 상태에 컴퓨터 화면에 표시되어 있는 것으로 한정 함으로써 음성 인식의 성능과 속도를 크게 개선시키기 위한 무제한 음성 명령어 인식기의 인식 성능 및 처리 속도 개선 방법에 관해 개시된다.
-
公开(公告)号:KR1019950034054A
公开(公告)日:1995-12-26
申请号:KR1019940010682
申请日:1994-05-16
IPC: G10L15/02
Abstract: 본 발명은 대어휘 음성인식을 위한 후보단어 추출장치 및 추출 방법에 관한 것으로, 후보단어 추출기의 효과는 대어휘 인식시에 인식단어일 확률이 희박한 단어를 미리 제외 시킴으로써 소요되는 계산 시간을 대폭 줄일수 있다. 따라서 음성 인식 시스템의 속도를 증진시킬 것이며 최종 인식단어 추출부의 담색 영역을 대폭 줄일수 있다.
-
公开(公告)号:KR101081972B1
公开(公告)日:2011-11-09
申请号:KR1020080128695
申请日:2008-12-17
Applicant: 한국전자통신연구원
Abstract: 본발명은하이브리드특징벡터를이용하여화자인식의정확성을향상시키는방법에관한것으로서, 특징벡터 AS-MFCC(Autocorrelation Sequence - Mel-Frequency Cepstral Coefficient)와 RAS-MFCC(Relative AS-MFCC)를동시에사용하는멀티스트리밍방법과서브밴드특징벡터재결합방법을혼합하여이용하며, 본발명에의하면잡음환경에서정확하고신뢰도높은인식결과를제공할수 있다.
-
16.
公开(公告)号:KR1020060091063A
公开(公告)日:2006-08-18
申请号:KR1020050011668
申请日:2005-02-11
Applicant: 한국정보통신대학교 산학협력단 , 한국전자통신연구원
IPC: G06F17/00
CPC classification number: G10L25/27 , G06F17/30755 , G06Q50/10 , G10H2210/036
Abstract: 본 발명은 음악 컨텐츠 분류 방법 그리고 이를 이용한 음악 컨텐츠 제공 시스템 및 그 방법에 관한 것이다.
본 발명에서는 음악 컨텐츠들을 클래식, 팝, 블루스, 가곡 등 일반적인 음악적 카테고리에 따라 분류하는 것이 아니고, 음악 컨텐츠간의 유사도를 표현하는 보다 근본적인 방법으로 음악 컨텐츠를 음색(Timbre), 리듬(Rhythm), 무드(Mood) 등으로 분류한다. 그리고 이와 같이 분류된 음악 컨텐츠를 토대로 하여 사용자가 요청한 음악 컨텐츠뿐만 아니라 비슷한 음악적 특징을 가진 음악 컨텐츠들도 함께 제공한다.
이러한 본 발명에 따르면 사용자에게 음악 컨텐츠를 다양하게 제공할 수 있으며, 또한 신뢰성을 가진 유사 음악 컨텐츠를 제공할 수 있다.
음악컨텐츠, 내용기반 음악검색, 유사음악, 유사도, 특징벡터, 벡터양자화-
公开(公告)号:KR100246617B1
公开(公告)日:2000-03-15
申请号:KR1019970058578
申请日:1997-11-06
Applicant: 한국전자통신연구원
Abstract: 1. 청구범위에 기재된 발명이 속한 기술분야
본 발명은 연속 피치 정보를 이용한 음성 검출 방법에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은, 외부로부터 입력된 신호에 대하여 에너지와 영교차율을 이용하여 음성인지 여부를 판단한 후에 음성 신호라고 판단되면 더 나아가서 연속적인 피치 정보 중 피치의 존재 범위 영역, 인접피치 사이의 주파수 변화량과 피치 발생수를 이용하여 음성을 검출하는 음성 검출 방법을 제공하고자 함.
3. 발명의 해결방법의 요지
본 발명은, 외부로부터 입력되는 음성 신호의 피치 정보를 검출하는 단계, 검출된 피치가 소정의 기준 피치 영역에 존재하는지를 확인하는 단계, 주파수 변화량을 계산한 후에 계산된 주파수 변화량이 소정의 제 1 기준값보다 작은지를 확인하는 단계 및 각 확인 결과에 따라 음성을 검출하는 단계를 포함한다.
4. 발명의 중요한 용도
본 발명은 음성 인식 시스템에 이용됨.-
公开(公告)号:KR100237385B1
公开(公告)日:2000-01-15
申请号:KR1019970037365
申请日:1997-08-05
Applicant: 한국전자통신연구원
Abstract: 본 발명은 인터넷에 접속하기 위해 이용되는 웹 브라우저를 사용할 때 마우스 뿐만 아니라 음성을 사용하여 웹 브라우저를 조작하고 이를 통해 원하는 정보를 얻을 수 있도록 해주는 웹 브라우저 상에서의 음성 인식기 구현방법에 관한 것으로서, 음성 인식 대상이 고정되어 있지 않고 끝없이 변화하는 웹 브라우저 상에서의 음성 인식 기능 구현을 목적으로 하고, 기존 웹 브라우저와 기 출원된 가변 어휘 인식기를 포함하되, HTML 파일 분석기, 인식 대상 어휘 생성기, 인식 결과 분석기를 구비하여 웹 브라우저의 사용자 인터페이스 편의성을 향상시킴으로써, 인터넷을 이용한 정보 자동화 및 통신 서비스, 쇼핑, 교육 등의 여러 분야에 응용할 수 있고 또한 손의 움직임이 불편한 장애자들도 인터넷을 보다 쉽게 이용할 수 있는 효과가 있다.
-
公开(公告)号:KR1019990043759A
公开(公告)日:1999-06-15
申请号:KR1019970064801
申请日:1997-11-29
Applicant: 한국전자통신연구원
IPC: G10L15/20
Abstract: 본 발명은 골도 마이크를 이용한 음성 인식 방법에 관한 것이다. 신호 대 잡음비가 10dB 내지 -5dB인 고 잡음 환경에서의 음성 인식 시스템은 음성에 섞여 있는 잡음으로 인해 정확한 음성 구간의 검출이 불가능하고 음성 특징 벡터 추출 시에도 잡음으로 인하여 입력된 음성 자체의 고유한 특징을 추출해 내기가 어렵다. 따라서 주변이 조용한 환경에서 잘 동작하는 음성 인식기를 고 잡음 환경에서 사용하면 인식 성능이 급격히 저하된다. 종래에는 이러한 문제점을 해결하기 위하여 주변 환경의 잡음이 마이크에 입력되는 비율을 낮추기 위해 지향성 마이크를 사용하는 방법, 입력된 신호로부터 잡음을 제거하기 위하여 아날로그/디지털 변환된 디지털 신호를 적응 신호처리 하여 음질을 개선하는 방법, 잡음이 혼합된 음성 신호로부터 잡음에 강인한 특징 벡터를 추출하는 방법 등을 사용하였다. 그러나 이러한 방법들도 고 잡음 환경에서는 여전히 정확한 음성 구간 검출이나 음성 자체의 고유한 특징을 추출해 내는데 한계가 있어, 음성 인식의 성능이 크게 개선되지 못하는 문제점이 있다. 따라서 본 발명에서는 고 잡음 환경에서 골도(bone conduction) 마이크를 사용함으로써 음성 입력 단계에서 미리 잡음을 제거하여 음성 인식 성능을 향상시킬 수 있는 골도 마이크를 이용한 음성 인식 방법이 제시된다.
-
公开(公告)号:KR1019990038741A
公开(公告)日:1999-06-05
申请号:KR1019970058578
申请日:1997-11-06
Applicant: 한국전자통신연구원
Abstract: 1. 청구범위에 기재된 발명이 속한 기술분야
본 발명은 연속 피치 정보를 이용한 음성 검출 방법에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은, 외부로부터 입력된 신호에 대하여 에너지와 영교차율을 이용하여 음성인지 여부를 판단한 후에 음성 신호라고 판단되면 더 나아가서 연속적인 피치 정보 중 피치의 존재 범위 영역, 인접피치 사이의 주파수 변화량과 피치 발생수를 이용하여 음성을 검출하는 음성 검출 방법을 제공하고자 함.
3. 발명의 해결방법의 요지
본 발명은, 외부로부터 입력되는 음성 신호의 피치 정보를 검출하는 단계, 검출된 피치가 소정의 기준 피치 영역에 존재하는지를 확인하는 단계, 주파수 변화량을 계산한 후에 계산된 주파수 변화량이 소정의 제 1 기준값보다 작은지를 확인하는 단계 및 각 확인 결과에 따라 음성을 검출하는 단계를 포함한다.
4. 발명의 중요한 용도
본 발명은 음성 인식 시스템에 이용됨.
-
-
-
-
-
-
-
-
-