Abstract:
모니터링 장치가 개시된다. 본 모니터링 장치는, 이격된 위치에서 촬영된 복수의 이미지 및 이격된 위치에서 청취된 복수의 음원을 입력받는 입력부, 복수의 이미지 각각에 대한 복수의 모노 돌출맵을 생성하고, 생성된 복수의 모노 돌출맵을 이용하여 동적 돌출맵을 생성하는 돌출맵 생성부, 복수의 음원을 분석하여 음원의 위치를 판단하는 위치 판단부, 생성된 동적 돌출맵 및 판단된 음원 위치를 기초로 복수의 이미지에 대한 경로를 생성하는 시선 경로 인식부 및 생성된 시선 경로를 출력하는 출력부를 포함한다.
Abstract:
PURPOSE: A view path providing apparatus and a view path providing method are provided to consider the dynamic movement of the image and the location of the sound source, at the same time, by the audio visual fusion information, thereby selecting the information with high reliability. CONSTITUTION: An input unit(110) receives an input of a plurality of image which is photographed in the separated position and a plurality of sound source which is listened from the separated location. A location decision unit(140) determines the location of the sound source through the analysis of a plurality of sound source. A protrusion map generator(150) produces a plurality of mono protrusion map about each image and produces the dynamic protrusion maps by using the produced mono protrusion map. A view path generator(160) produces the view path about a plurality of image based on the dynamic protrusion map and the sound source location. [Reference numerals] (110) Input unit; (120) Output unit; (130) Storage unit; (140) Location decision unit; (150) Protrusion map generator; (160) View path generator; (170) Control unit
Abstract:
A noise cancelation apparatus for headphones using an independent component analysis adaptive filter includes; an external microphone installed at an outside of the headphones and to receive an external noise; a feedforward adaptive filter using independent component analysis which receives a noise signal output from the external microphone to perform the convolution for an adaptive filter coefficient using the noise signal as a reference signal for generating an attenuation signal; a subtracter which subtracts the attenuation signal from a target signal provided from the outside; and an error microphone installed inside the headphones. An output signal is outputted through a speaker of the headphones. The adaptive filter coefficient is learned by receiving an error signal from the error microphone to minimize a component which is not correlated to each other between the target signal and the noise signal.
Abstract:
시선 경로 제공장치가 개시된다. 본 시선 경로 제공장치는, 이격된 위치에서 촬영된 복수의 이미지 및 이격된 위치에서 청취된 복수의 음원을 입력받는 입력부, 복수의 음원을 분석하여 음원의 위치를 판단하는 위치 판단부, 복수의 이미지 각각에 대한 복수의 모노 돌출맵을 생성하고, 생성된 복수의 모노 돌출맵을 이용하여 동적 돌출맵을 생성하는 돌출맵 생성부, 생성된 동적 돌출맵 및 판단된 음원 위치를 기초로 복수의 이미지에 대한 시선 경로를 생성하는 시선 경로 생성부, 및, 생성된 시선 경로를 출력하는 출력부를 포함한다.
Abstract:
PURPOSE: Time delay of signal and a mute sound source dividing method in repercussion environment based on attenuation estimation are provided to consider repercussion environment, estimate per-frequency attenuation and time delay value, and divide mute sound source signal, thereby improve dividing function of the mute sound source signal. CONSTITUTION: Mute sound source divider performs initialization for per-frequency attenuation and time delay value for inputted mixed signal(200). The mute sound source divider learns the per-frequency attenuation and time delay value(202). The mute sound source divider divides per-frequency signal by usage of per-frequency binary mask(206). The mute sound source divider matches order by acquisition of coefficient of correlation of the divided signal(208). The mute sound source divider optimizes the order(210). [Reference numerals] (200) Initializing a per-frequency attenuation and time delay value; (202) Learning a per-frequency attenuation and time delay value; (204) Generating a per-frequency binary mask; (206) Dividing a per-frequency sound source signal by using a per-frequency binary mask; (208) Arranging orders by obtaining correlation coefficient for each per-frequency dividing signal; (210) Order optimization; (AA) Start; (BB) End
Abstract:
본 발명에 따른 강한 음성 인식 시스템은 전처리(pre-processing) 과정인 MPDR 빔포머를 사용하여 음원을 향상시킨 후, 향상된 음원 신호들과 노이즈 신호들의 합성신호에 대하여 HIVA 학습 알고리즘을 적용하여 음원 신호에 대한 특징 벡터를 추출하는 것을 특징으로 한다. 상기 음성 인식 시스템은 신호 왜곡을 최소화시키고 언믹싱 매트릭스에 대한 컨버전스를 향상시키기 위하여, HIVA 학습 알고리즘을 수행함에 있어서, non-holonomic constraint와 최소 왜곡 원칙(Minimal Distortion Priciple; 이하 'MDP'라 한다)을 적용하는 것을 특징으로 한다. 또한, 상기 음성 인식 시스템은 향상된 음원과 노이즈 음원을 이용하여 학습 과정에서 손실된 특징들(Missing Features)을 파악하고 이를 보상하는 것을 특징으로 한다. 전술한 특징들에 의하여, 본 발명에 따른 강한 음성 인식 시스템은 하모닉 주파수 의존성을 이용한 독립 벡터 분석 알고리즘을 기반으로 하여 노이즈 등에 강한 시스템을 제공하게 된다.
Abstract:
본 발명에 따르는 클러스터 기반 손실 특징 복원 알고리즘을 위한 마스크 추정 방법은, 관찰신호를 입력받아 관심음원을 검출하는 단계; 상기 관찰신호와 상기 관심음원을 제공받아 주파수별 SIR을 산출하는 단계; 상기 주파수별 SIR를 토대로 주파수마다 상이한 문턱값을 가지는 이진 마스크를 추정하는 단계;를 구비함을 특징으로 한다.