마이크 어레이를 이용한 원격음성입력장치 및 그 원격음성입력 처리방법

    公开(公告)号:KR100198019B1

    公开(公告)日:1999-06-15

    申请号:KR1019960055690

    申请日:1996-11-20

    Inventor: 서영주 이영직

    Abstract: 본 발명은 컴퓨터를 이용한 음성인식시스템의 응용분야에서 마이크 어레이를 이용한 원격음성입력장치 및 그 원격음성입력 처리 방법에 관한 것으로서, 종래기술에서의 하나의 마이크로 음성을 입력하는 경우에 마이크의 위치에 항상 세심한 주위를 기울여야 하기 때문에 사용상에 많은 불편이 발생하였던 문제점을 해결하기 위해, 본 발명은 다채널의 마이크 어레이를 구비하고, 이 다채널의 마이크들로부터 시간지연 값들이 다른 음성신호를 동시에 입력받아 디지털신호로 변환하는 마이크 어레이와, 마이크 어레이로부터 입력되는 다채널의 신호들로부터 음성신호를 검출하는 자동음성 검출부와, 그 검출된 각 채널간 음성신호들의 시간지연 정보를 추정하는 시간지연 추정부와; 및 추정된 시간지연 정보를 이용하여 신호대 잡음비가 향상된 음성을 생성해내기 위해 채널간의 음성신호에 존재하는 시간지연을 상쇄시킨 후 모든 채널의 음성신호를 가산하는 시간지연 및 신호가산부로 구성되어, 마이크와 화자가 약 40~80cm 정도의 거리를 두고, 마이크의 위치에 주위를 기울이지 않고 발성할 경우에도 허용된 수준(25dB) 이상의 신호대 잡음비를 갖는 음성을 자동으로 입력받는 기능을 갖도록 개발하여 이 음성을 음성인식시스템의 입력으로 사용할 경우, 우수한 성능을 나타낼 수 있도록 하였다.

    신경망을 이용한 유성음, 무성음, 묵음 구간 부류화 장치 및 방법
    2.
    发明公开
    신경망을 이용한 유성음, 무성음, 묵음 구간 부류화 장치 및 방법 无效
    使用神经网络发声,无声,无声部分的设备和方法

    公开(公告)号:KR1019990043142A

    公开(公告)日:1999-06-15

    申请号:KR1019970064129

    申请日:1997-11-28

    Inventor: 서영주 박준

    Abstract: 1. 청구범위에 기재된 발명이 속한 기술분야
    본 발명은 신경망을 이용한 유성음, 무성음, 묵음 구간 부류화 장치 및 방법에 관한 것임.
    2. 발명이 해결하려고 하는 기술적 과제
    본 발명은, 특징 파라메터들을 입력으로 하는 예측 재귀 신경망을 이용하여 유성음, 무성음, 및 묵음의 여부를 프레임별로 판정하여, 출력하는 유성음, 무성음, 묵음 구간 부류화 장치 및 방법을 제공하고자 함.
    3. 발명의 해결방법의 요지
    본 발명은, 음성을 디지털 신호로 변환하는 신호 입력 수단과, 특징 파라메터를 추출하는 특징 파라메터 추출 수단과, 분석할 프레임이 유성음인지 무성음인지 묵음인지의 여부를 판정하는 판정 수단, 및 판정 정보를 입력받아 시간 프레임마다 출력을 하거나, 입력의 시작부터 종료까지를 묶어 일률적으로 출력하는 유성음/무성음/묵음 정보 출력 수단을 포함한다.
    4. 발명의 중요한 용도
    본 발명은 음성 인식 장치, 음성 합성 장치, 음성 분석 장치에 이용됨.

    다층구조 신경망을 이용한 음소 분할 방법

    公开(公告)号:KR100173923B1

    公开(公告)日:1999-04-01

    申请号:KR1019950053941

    申请日:1995-12-22

    CPC classification number: G10L15/04 G10L25/30 G10L2015/025

    Abstract: A phoneme dividing method using a multilevel neural network applied to a phoneme dividing apparatus having a voice input portion, a preprocessor, a multi-layer perceptron (MLP) phoneme dividing portion, and a phoneme border outputting portion includes the steps of: (a) sequentially segmenting and framing voice with digitalized voice samples, extracting characteristic vectors by vocal frames, and extracting an inter-frame characteristic vector of the difference between nearby frames of the characteristic vectors by frames, to thereby normalize the maximum and minimum of the characteristics; (b) storing information on the weight obtained through learning and the standard of the MLP; and (c) reading the weight obtained in the step (b), receiving the characteristic vectors, performing an operation of phoneme border discrimination to generate an output value, discriminating the phoneme border according to the output value, and if the current analyzed frame arrives two frames preceding the final frame of incoming voice, outputting a frame number indicative of the border of phoneme as a final result.

    음성 인식용 원격 음성 입력기
    4.
    发明公开
    음성 인식용 원격 음성 입력기 失效
    用于语音识别的远程语音输入设备

    公开(公告)号:KR1019980044599A

    公开(公告)日:1998-09-05

    申请号:KR1019960062701

    申请日:1996-12-07

    Abstract: 본 발명은 음성인식용 원격 음성 입력기에 관한 것이다. 그 목적은 음성인식 기능이 부가된 화상회의나 자동통역 등 멀티미디어 통신환경에서 저렴한 하드웨어로 높은 인식률과 빠른 속도를 갖고 원음성신호에 가까운 출력신호를 얻는 데에 있다. 그 특징은 음성인식 기능이 부가된 화상회의나 자동통역 등의 멀티미디어 통신환경에서의 음성인식용 원격 음성 입력기에 있어서, 상대방의 모습을 보여주고, 또한 사용자의 음성신호를 입력받는 화면 표시수단과, 상기 화면 표시수단으로부터 복수의 음성신호를 입력받아 모두 가산하는 아날로그 신호 가산수단과, 상기 아날로그 신호 가산수단으로부터 가산된 아날로그 신호를 입력받아 디지털 신호로 출력하는 신호 변환수단 및 상기 신호 변환수단으로부터 디지털 신호를 입력받아 음성을 해석하고 인식하는 음성 인식수단으로 구성되어, 신호대잡음비와 음성 인식률을 증가시키는 데에 있다.

    의사형태소를 이용한 음성 인식 단위 설정 방법
    5.
    发明公开
    의사형태소를 이용한 음성 인식 단위 설정 방법 有权
    如何用伪语素建立语音识别单元

    公开(公告)号:KR1019990047329A

    公开(公告)日:1999-07-05

    申请号:KR1019970065686

    申请日:1997-12-03

    Abstract: 본 발명은 의사형태소를 이용한 음성 인식 단위의 설정 방법에 관한 것이다. 음성 인식에서는 사전에 등록되는 어휘가 음성 인식의 기본 작업 단위가 되며 인식 대상 어휘의 수가 음성 인식 작업의 난이도와 인식 성능을 결정하는 요소가 된다. 종래에는 어절, 음절 또는 음소 단위로 인식 단위를 설정하여 입력되는 음성을 인식하고 처리하였다. 그러나 어절을 인식 단위로 하여 음성을 인식할 경우 인식 대상이 되는 어휘의 수가 증가하여 확장성이 저하되고 음절이나 음소를 인식 단위로 할 경우에는 언어학적 특성이 사라져 후처리시에 언어 지식을 적용하기가 어려워지는 문제점이 있다. 또한 형태소를 인식 단위로 하는 방법이 있는데, 이 경우에도 어절을 형태로소 분리할 때 생략되거나 축약된 형태소가 재생되어 원래 어절의 소리값과 형태소로 분리된 소리값이 일치하지 않게 되는 문제점이 있다. 이러한 문제점을 해결하기 위하여 본 발명에서는 인식 단위 각각이 언어학적 특성과 주어진 어절의 소리값을 유지하면서 전체 인식 대상 어휘의 수를 감소시킬 수 있는 의사형태소를 도입하고 입력된 어절을 내용어와 기능어로 분리하여 음성을 인식하므로써 음성 인식 대상 어휘의 수를 적절한 수로 유지하게 되어 음성 인식 시스템의 작업 영역을 확장할 수 있는 의사형태소를 이용한 음성 인식 단위 설정 방법이 제시된다.

    한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법

    公开(公告)号:KR1019970050115A

    公开(公告)日:1997-07-29

    申请号:KR1019950055840

    申请日:1995-12-23

    Abstract: 본 발명은 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법에 관한 것으로, 삼음소열 또는 이에 해당하는 코드열을 입력받아 중음소가 자음, 모음, 묵음중 어느 것인가 판단하는 제1단계; 상기 중음소가 자음이면 좌음소와 우음소 모음군 부류화 또는 좌음소 모음군 부류화를 수행하는 제2단계; 상기 중음소가 모음이면 좌음소가 우음소에 따라 우음소 초성, 종성 좌음군 부류화, 우음소 SIL(silence)노드화, 좌음소 초성 자음군 부류화를 수행하는 제3단계; 및 상기 중음소가 묵음이면 SIL 노드화하는 제4단계를 포함하는 것을 특징으로 하여 음소단위나 트라이폰 단위를 기반으로 하는 음성인식, 음성합성에 보다 유용한 모델링 및 분석 단위로 사용할 수 있는 효과가 있다.

    의사형태소를 이용한 음성 인식 단위 설정 방법
    7.
    发明授权
    의사형태소를 이용한 음성 인식 단위 설정 방법 有权
    使用PSEUDO MORPHEM设置用于语音识别的单元的方法

    公开(公告)号:KR100263297B1

    公开(公告)日:2000-08-01

    申请号:KR1019970065686

    申请日:1997-12-03

    Abstract: PURPOSE: A voice recognition unit determination method using a quasi-feature component is provided to maintain the number of candidate vocabulary for voice recognition to expand operation region of a voice recognition system. CONSTITUTION: The voice recognition unit determination method using the quasi-feature component includes following steps. At first, input syllable is divided by a feature component base classifier(101). Whether a sound value is maintained in the output of the feature component base classifier is checked(102). When the sound value is maintained, the feature component division result is output and whether a syllable to be processed exists is determined(103). When more syllable exists, input syllable is divided by the feature component classifier or process is terminated otherwise. When the sound value is not maintained, whether the input syllable is registered in a division rule is determined. When the input syllable is registered in the division rule, the syllable is divided using the rule, the result is output and whether more syllable to be processed exists is determined(105). When more syllable exists, input syllable is divided by the feature component classifier or process is terminated otherwise. When the input syllable is not registered in the division rule, whether an automatic mode is to be performed is determined(106). When yes, the syllable is registered in a non-divided word files, the input syllable is output as it is and whether more syllable to be processed exists is determined. When more syllable exists(107), input syllable is divided by the feature component classifier or process is terminated otherwise. When the mode in not automatic, the input syllable is divided manually and the rule for the division is registered(108). The result is output and whether more syllable to be processed exists is determined(110). When more syllable exists, input syllable is divided by the feature component classifier or process is terminated otherwise.

    Abstract translation: 目的:提供一种使用准特征分量的语音识别单元确定方法,以维持用于语音识别的候选词汇数量,以扩大语音识别系统的操作区域。 构成:使用准特征成分的语音识别单元确定方法包括以下步骤。 首先,输入音节由特征分量基本分类器(101)分割。 检查特征组分基类分类器的输出中是否保持声音值(102)。 当保持声音值时,确定特征分量分割结果,并确定是否存在待处理的音节(103)。 当存在更多的音节时,输入音节由特征分量分类器除以否则终止。 当声音值不被维持时,确定输入音节是否被记录在分割规则中。 当输入音节被注册在分割规则中时,使用规则划分音节,输出结果以及是否存在待处理的多个音节存在(105)。 当存在更多的音节时,输入音节由特征分量分类器除以否则终止。 当输入音节未在分割规则中登记时,确定是否执行自动模式(106)。 当是的时候,音节被注册在一个非分割的单词文件中,输入音节是按原样输出的,并确定是否存在要处理的更多的音节。 当存在更多的音节(107)时,输入音节由特征分量分类器除以否则终止。 当模式不自动时,输入音节被手动分割,并且分配的规则被注册(108)。 确定结果是输出,是否存在更多的音节被处理存在(110)。 当存在更多的音节时,输入音节由特征分量分类器除以否则终止。

    음성 신호의 실시간 음성부 검출 방법
    8.
    发明授权
    음성 신호의 실시간 음성부 검출 방법 失效
    语音信号的实时检测方法

    公开(公告)号:KR100128669B1

    公开(公告)日:1998-04-22

    申请号:KR1019940024034

    申请日:1994-09-23

    Abstract: 본 발명은 음성신호의 실시간 음성부 검출 방법에 관한 것으로, 특히, 음성신호를 입력받을시 묵음부분을 자동으로 제거하고 순수한 음성부분만을 실시간으로 검출할 수 있는 음성신호의 실시간 음성부 검출 방법에 관한 것으로, 특히, 실시간 구현이 가능하며, 시작점 검출을 위한 임계치와 끝점 검출을 위한 임계치를 서로 다르게 설정함으로써 종래 기술보다 음성부의 끝점 구간에서 매우 향상된 결과를 보였고, 시작점과 끝점 검출을 위한 임계치가 사용환경에 따라 적절히 변화되므로 알고리즘이 적용환경에 크게 영향을 받지 않고 일정수단 이상의 성능을 유지할 수 있고, 비교적 간단한 파라메타와 알고리즘을 사용하므로 구현이 용이한 효과가 있다.

    유성음, 무성음, 묵음 구간 정보를 이용한 음성인식방법 및 음성인식장치
    9.
    发明公开
    유성음, 무성음, 묵음 구간 정보를 이용한 음성인식방법 및 음성인식장치 无效
    使用有声,无声,无声区间信息的语音识别方法和语音识别装置

    公开(公告)号:KR1019990050440A

    公开(公告)日:1999-07-05

    申请号:KR1019970069559

    申请日:1997-12-17

    Abstract: 본 발명은 컴퓨터를 이용한 음성인식 응용분야에서 유성음, 무성음, 묵음 구간 정보를 이용한 음성인식방법 및 음성 인식장치에 관한 것으로, 종래의 음성인식장치는 음성신호에 대해 프레임 단위로 특징 벡터를 추출하여 이를 음소나 유사 음소 단위로 모델링한 후, 입력된 미지의 특징 벡터를 탐색기에서 음소나 유사 음소 단위의 모델과 비교하는 방법을 사용하므로써 탐색 시간의 증가 및 인식 대상어의 증가로 인한 모호성이 커졌다. 이에 본 발명은 인간의 음성이 입력되었을 때 입력된 신호중에서 일반적으로 음성인식에 사용되는 기존의 특징 파라메터와 더불어 음성신호를 유성음/무성음/묵음으로 잘 부류화시킬 수 있는 또다른 특징 파라메터를 추가로 추출하여 유성음, 무성음, 및 묵음의 구간을 정확히 부류화시키고, 이 유성음/무성음/묵음으로 부류화된 정보를 음성인식기의 탐색기에서 부가적으로 사용하여 탐색 대상을 축소시킴으로써 기존의 음성인식기에 비해 현저한 탐색 시간의 감축 및 탐색 성능의 향상을 가져오게 하였다.

    음성 인식용 원격 음성 입력기

    公开(公告)号:KR100194579B1

    公开(公告)日:1999-06-15

    申请号:KR1019960062701

    申请日:1996-12-07

    Abstract: 본 발명은 음성인식용 원격 음성 입력기에 관한 것이다. 그 목적은 음성인식 기능이 부가된 화상회의나 자동통역 등 멀티미디어 통신환경에서 저렴한 하드웨어로 높은 인식률과 빠른 속도를 갖고 원음성신호에 가까운 출력신호를 얻는 데에 있다. 그 특징은 음성인식기능이 부가된 화상회의나 자동통역 등의 멀티미디어 통신환경에서의 음성인식용 원격 음성 입력기에 있어서, 상대방의 모습을 보여주고, 또한 사용자의 음성신호를 입력받는 화면 표시수단과, 상기 화면 표시수단으로부터 복수의 음성신호를 입력받아 모두 가산하는 아날로그 신호 가산수단과, 상기 아날로그 신호 가산수단으로부터 가산된 아날로그 신호를 입력받아 디지털 신호로 출력하는 신호 변환수단 및 상기 신호 변환수단으로부터 디지털 신호를 입력받아 음성을 해석하고 인식하는 음성인식수단으로 구성되어, 신호대잡음비와 음성 인식률을 증가시키는 데에 있다.

Patent Agency Ranking