Abstract:
본 발명에서 제안하고 있는 화자 인식을 위한 음성인식기 기반 풀링 기법의 화자 임베딩 추출 방법 및 시스템, 그리고 이를 위한 기록매체에 따르면, 화자 임베딩 추출 과정에서 화자 정보만을 고려하던 기존의 기법들과 달리, 프레임 단위의 출력을 집계하는 과정에서 문자 단위의 개별적 처리 과정을 갖기 때문에 추론 단계에서 화자 임베딩간의 유사도 계산 시 특정 발음 간의 특징 비교를 가능하도록 하며, 이를 통해 화자 인식 시스템에서 화자 정보 및 문장 발화 정보를 동시에 고려하여 비교 분석할 수 있도록 할 수 있다.
Abstract:
본 발명에서 제안하고 있는 자연어로 기술되는 스타일 태그를 활용하여 운율 조절이 가능한 멀티 스타일 음성 합성 시스템에 따르면, 스타일 음성 합성 시 기존의 스타일 라벨이나 참조 음성을 활용함에 따른 발화할 수 있는 스타일 개수의 제한과, 사용자가 발화할 때마다 참조 음성을 찾아 입력해야 하는 번거로움 없이 스타일 태그를 활용하여 사용자가 직관적으로 간편하게 음성의 스타일을 조절할 수 있도록 할 수 있다.
Abstract:
본 발명에서 제안하고 있는 비화자 요소에 강인한 화자 임베딩 추출 방법 및 장치, 그리고 이를 위한 기록매체에 따르면, 화자 분류기만을 학습하는 기존 방식의 기법들과 달리, 화자 임베딩 추출 과정에서 비 화자 요소에 대한 정보가 감소하도록 임베딩 시스템을 학습하고, 화자 임베딩은 화자에 대한 정보는 높이되, 비화자 요소에 대한 정보는 최소화되도록 학습됨에 따라 얻어진 화자 임베딩은 보다 비화자 정보로 인한 성능 열화가 최소화되고, 그에 따른 비화자 요소에 강인한 화자 임베딩 추출이 가능하도록 할 수 있다.
Abstract:
본 발명은 오디오 신호의 보존에 기초한 음파 통신에서 정보 송수신 시스템 및 방법, 그리고 이에 적용되는 장치를 개시한다. 본 발명에 따른 오디오 신호의 보존에 기초한 음파 통신에서 정보 송수신 시스템은, 가청주파수 대역에서 원래 음원의 손상이 없이 사람의 귀에 들리지 않게 데이터를 삽입하여 오디오 콘텐츠를 이용한 음파 통신을 하기 위한 구성으로 이루어진다. 따라서, 본 발명은 기존의 TV/라디오 방송망 및 사설 구내방송 등의 기존 시설에 대한 변경 없이 오디오 콘텐츠 기반의 부가 데이터를 휴대폰 등과 같은 개인 음향기기로 전달할 수 있으며, 오디오 콘텐츠에 대한 원음에 대한 손상을 최대한으로 줄이면서 음파 통신으로 데이터를 전달할 수 있다.
Abstract:
PURPOSE: A mobile robot with a caterpillar and a driving wheel is provided to enhance energy efficiency by preventing unnecessary use of power when driving. CONSTITUTION: A mobile robot with a caterpillar and a driving wheel comprises a body unit(100), a main wheel support board(200), an auxiliary wheel support board(300), a first driving wheel(410), a driving caterpillar(430), a second driving wheel(420), a first driving motor, a caterpillar assembly motor, a caterpillar driving motor, a second driving motor, and a control unit. The caterpillar assembly motor assembles the driving caterpillar. The control unit controls operation of the first driving motor, the caterpillar assembly motor, the caterpillar driving motor, and the second driving motor.
Abstract:
PURPOSE: A sound quality improvement device and a method thereof are provided to minimize quality degradation generated by inserting data into an original sound signal. CONSTITUTION: A sound signal quality improvement device(110) includes a coefficient calculation unit(111), a size calculation unit(112), a phase value storage unit(113), and a quality correcting unit(114). The coefficient calculation unit calculates the frequency conversion coefficient of a sound signal by converting frequencies for the original sound signal and the sound signal including data. A size calculation unit calculates the size of a frequency conversion coefficient in the sound signal including the data and the frequency conversion coefficient of the original sound signal. The phase value storage unit stores the phase value of the sound signal including the data. The quality correcting unit corrects the quality of the sound signal including the data based on the phase value and size of the frequency coefficient of the sound signal. [Reference numerals] (111) Coefficient calculation unit; (112) Size calculation unit; (113) Phase value storage unit; (114) Quality correcting unit; (115) SNR calculation unit; (116) Adjusting unit; (117) Converting unit