전경 영역 국소화 장치 및 방법

    公开(公告)号:KR1020180078882A

    公开(公告)日:2018-07-10

    申请号:KR1020160184132

    申请日:2016-12-30

    Inventor: 박형민 제창수

    CPC classification number: G06T3/40 G06T7/194 G06T7/344 G06T2207/20221

    Abstract: 본발명의실시예에따른영상에서전경영역을국소화하는방법은, 영상을입력받는영상입력단계와, 영상에서회색또는컬러가우스혼합모델에기반을둔 배경혼합모델을사용하여다수의전경후보픽셀을추출하는단계와, 다수의전경후보픽셀들에공간적가우스혼합모델피팅을수행하여공간적가우스혼합모델을생성하는단계와, 공간적가우스혼합모델의성분을각 성분의비중의내림차순으로정렬하는단계및 공간적가우스혼합모델의성분을정렬된순서에따라차례로, 평균이가까운두 성분을병합하는과정을마지막성분에까지반복수행하는단계를포함하여구성된다.

    단일 영상으로부터 반사성분을 분리하는 방법 및 그 방법에 따른 영상처리 장치

    公开(公告)号:KR101772626B1

    公开(公告)日:2017-08-29

    申请号:KR1020160013267

    申请日:2016-02-03

    Inventor: 제창수 박형민

    Abstract: 본발명은단일영상내의반사성분을분리하는방법및 그방법에따른영상처리장치에관한것으로, 영상처리장치는, 단일영상을입력받고, 입력영상에서, 각컬러채널의반사조도(reflected irradiance) 또는각 컬러채널의광도(intensity)를상기각 컬러채널의조명(illumination)으로나누어서얻어지는혼합반사도(mixed reflectance)에서상기혼합반사도의분광적평균(mean with respect to the spectral channel index)인혼합중분(mixed neuter)을제외한잔여성분인체정분(body essence)을이용하여이색성반사성분(dichromatic reflection components)을분리하고, 이색성반사성분의분리에따라광휘(highlight) 영상과광휘가제거된영상중 하나이상을출력한다.

    강인한 음성 인식을 위한 실시간 타겟 음성 분리 방법
    53.
    发明授权
    강인한 음성 인식을 위한 실시간 타겟 음성 분리 방법 有权
    用于强大的自动语音识别的在线目标语音提取方法

    公开(公告)号:KR101658001B1

    公开(公告)日:2016-09-21

    申请号:KR1020150037314

    申请日:2015-03-18

    Inventor: 박형민 김민욱

    Abstract: 본발명은강인한음성인식을위한타겟음성신호분리방법에관한것이다. 상기타겟음성신호분리방법은, (a) 마이크로폰에대한타겟음원의도달방향(Direction of Arrival)에대한정보를제공받는단계; (b) 상기타겟음원의도달방향에대한정보를이용하여, 입력신호들로부터타겟음성신호를제거하고노이즈를추정하기위한널포머(Nullformer)를생성하는단계; (c) 적응형벡터()를이용한타겟음원의실제출력은제1 채널로설정하고, 널포머에의한더미출력은나머지채널로설정하는단계; (d) 독립성분분석을이용하여타겟음원의실제출력(real output)과널포머를이용한더미출력(dummy output)간의의존성을최소화시키기위한비용함수를설정하는단계; (e) 상기비용함수를이용하여타겟음원을추정하는단계; 를구비하여, 상기입력신호들로부터타겟음성신호를분리해낸다.

    Abstract translation: 本发明涉及一种分离用于鲁棒语音识别的目标语音信号的方法。 该方法包括以下步骤:(a)接收关于麦克风的目标声源的到达方向的信息; (b)通过使用关于目标声源的到达方向的信息来消除来自输入信号的目标声音信号并创建用于估计噪声的零点成形器; (C)通过使用自适应形式向量(W(K))将目标声源设置为第一声道,以及通过使用成形器将虚拟输出设置为剩余声道; (d)通过使用独立分量分析,设定用于使目标声源的实际输出与虚拟输出之间的依赖关系最小化的成本函数; (e)使用成本函数估计目标声源; 并且由此目标语音信号与输入信号分离。

    독립 벡터 분석 및 모델 기반 특징 향상을 이용한 강인한 음성 인식 방법
    54.
    发明授权
    독립 벡터 분석 및 모델 기반 특징 향상을 이용한 강인한 음성 인식 방법 有权
    基于HMM的特征增强下的独立矢量分析用于强大的语音识别

    公开(公告)号:KR101647059B1

    公开(公告)日:2016-08-10

    申请号:KR1020150037384

    申请日:2015-03-18

    Inventor: 박형민 조지원

    CPC classification number: G10L21/0216 G10L15/142

    Abstract: 본발명은독립벡터분석및 모델기반특징향상방법을이용한강인한음성인식방법에관한것이다. 상기음성인식방법은, (a) 마이크로폰으로입력된신호들에대하여독립벡터분석(Independent Vector Analysys)하여 IVA 타겟음성신호와 IVA 노이즈신호를추정하는단계; (b) 상기추정된 IVA 타겟음성신호및 IVA 노이즈신호를각각입력신호및 노이즈신호로설정하여, 모델기반특징향상(Model-based Feature Enhancement;'MBFE') 방법을적용하여타겟음성신호를추정하는단계; 를구비하여음성인식의정확도를향상시킨다.

    Abstract translation: 本发明涉及使用独立矢量分析和基于模型的特征增强的强声音识别方法。 语音识别方法包括以下步骤:(a)通过分析通过麦克风输入的信号的独立向量来估计独立矢量分析(IVA)目标语音信号和IVA噪声信号; (b)分别设置估计的IVA目标语音信号和IVA噪声信号作为输入信号和噪声信号,并通过应用基于模型的特征增强的方法来估计目标语音信号,从而提高语音的准确性 承认。

    강인음성인식을 위한 손실특징 복원방법 및 장치
    55.
    发明授权
    강인음성인식을 위한 손실특징 복원방법 및 장치 有权
    基于特征向量的HMM的强大的语音识别丢失特征重构

    公开(公告)号:KR101647058B1

    公开(公告)日:2016-08-10

    申请号:KR1020150037383

    申请日:2015-03-18

    Inventor: 박형민 조지원

    CPC classification number: G10L21/02

    Abstract: 본발명에따르는강인음성인식을위한손실특징복원방법은, 스펙트럼벡터형태의관찰데이터가하나의프레임을형성하고, 다수의프레임이시간경과에따라순차적으로나열되어구성된관찰시퀀스를입력받아, 현재프레임에대한상태인덱스에대한정보를토대로신뢰성분은그대로출력하고비신뢰성분은최소화시켜출력하는단계; 및상기비신뢰성분은관찰데이터의비신뢰성분의값보다작고, 모든프레임에신뢰성분의값이주어지고, 현재프레임의상태인덱스가정해졌다면, 모든상태의사후확률을곱한후 더해서최종적인비신뢰성분의값을추정하는단계;를더 구비함을특징으로한다.

    Abstract translation: 根据本发明的用于恢复强烈语音识别的丢失特征的方法包括以下步骤:通过以频谱矢量形式的观测数据形成一帧,接收由多个帧排列的观察序列 随着时间流逝,有序的方式根据当前帧的状态索引的信息输出它们的置信分量,并通过最小化来输出不可信分量; 并且还包括以下步骤:如果所述非置信分量小于所述观测数据的不可信分量的值,则通过将每个状态的后验概率相乘之后相加来估计最终不可信分量的值, 给出每个帧的置信分量,并且确定当前帧的状态索引。 本发明旨在提供一种用于通过使用隐马尔可夫模型的语音的频率和时间依赖性来恢复强的语音识别的损失特征的方法和装置。

    CIELAB 색 공간에서의 통합된 멀티 스케일 레티넥스를 수행하는 이미지 처리 방법 및 장치
    56.
    发明公开
    CIELAB 색 공간에서의 통합된 멀티 스케일 레티넥스를 수행하는 이미지 처리 방법 및 장치 有权
    基于CIELAB彩色空间的综合多尺度雷达图像处理方法和装置保存色彩

    公开(公告)号:KR1020160001897A

    公开(公告)日:2016-01-07

    申请号:KR1020140079924

    申请日:2014-06-27

    Abstract: 본발명에따르는 CIELAB 색공간에서의통합된멀티스케일레티넥스를수행하는이미지처리방법은, 이미지정보를입력받아 RGB 색공간에서 CIELAB 색공간으로변환하는단계; 상기 CIELAB 색공간의이미지정보중채널에대해중심픽셀과주변픽셀의색상차이를반영한커널을이용하여휘도를향상하는단계; 상기휘도의향상에비례하여채도를조정하는단계: 상기채도를조정한이미지정보를 RGB 색공간으로변환하는단계;를포함하는것을특징으로한다.

    Abstract translation: 根据本发明,用于在国际照明委员会(CIE)Lab颜色空间委员会中执行综合多尺度retinex的图像处理方法包括以下步骤:接收图像信息以转换红色,绿色和蓝色( RGB)色彩空间变成CIELAB色彩空间; 通过使用从CIELAB颜色空间的图像信息反映相对于通道的中心像素和周边像素的色差的内核来提高亮度; 与亮度的提高成比例地调节色度; 以及将由色度调整的图像信息转换为RGB颜色空间。

    독립성분분석 적응필터를 이용한 헤드폰 유입잡음 제거방법 및 장치
    58.
    发明授权
    독립성분분석 적응필터를 이용한 헤드폰 유입잡음 제거방법 및 장치 有权
    噪声消除方法和装置使用独立的元件分析耳机

    公开(公告)号:KR101442700B1

    公开(公告)日:2014-09-23

    申请号:KR1020130105730

    申请日:2013-09-03

    CPC classification number: H04R3/04 H04R1/1083 H04R2410/05

    Abstract: A noise cancelation apparatus for headphones using an independent component analysis adaptive filter includes; an external microphone installed at an outside of the headphones and to receive an external noise; a feedforward adaptive filter using independent component analysis which receives a noise signal output from the external microphone to perform the convolution for an adaptive filter coefficient using the noise signal as a reference signal for generating an attenuation signal; a subtracter which subtracts the attenuation signal from a target signal provided from the outside; and an error microphone installed inside the headphones. An output signal is outputted through a speaker of the headphones. The adaptive filter coefficient is learned by receiving an error signal from the error microphone to minimize a component which is not correlated to each other between the target signal and the noise signal.

    Abstract translation: 使用独立分量分析自适应滤波器的耳机噪声消除装置包括: 安装在耳机外部并接收外部噪声的外部麦克风; 使用独立分量分析的前馈自适应滤波器,其接收从外部麦克风输出的噪声信号,以使用噪声信号作为用于产生衰减信号的参考信号来执行自适应滤波器系数的卷积; 从外部提供的目标信号中减去衰减信号的减法器; 并安装在耳机内的错误麦克风。 通过耳机的扬声器输出输出信号。 通过从误差麦克风接收误差信号来学习自适应滤波器系数,以使在目标信号和噪声信号之间彼此不相关的分量最小化。

    시선 경로 제공장치 및 시선 경로 제공방법
    59.
    发明授权
    시선 경로 제공장치 및 시선 경로 제공방법 有权
    提供眼睛扫描路径的设备和提供眼睛扫描路径的MEED

    公开(公告)号:KR101314687B1

    公开(公告)日:2013-10-07

    申请号:KR1020110129935

    申请日:2011-12-06

    Abstract: 시선 경로 제공장치가 개시된다. 본 시선 경로 제공장치는, 이격된 위치에서 촬영된 복수의 이미지 및 이격된 위치에서 청취된 복수의 음원을 입력받는 입력부, 복수의 음원을 분석하여 음원의 위치를 판단하는 위치 판단부, 복수의 이미지 각각에 대한 복수의 모노 돌출맵을 생성하고, 생성된 복수의 모노 돌출맵을 이용하여 동적 돌출맵을 생성하는 돌출맵 생성부, 생성된 동적 돌출맵 및 판단된 음원 위치를 기초로 복수의 이미지에 대한 시선 경로를 생성하는 시선 경로 생성부, 및, 생성된 시선 경로를 출력하는 출력부를 포함한다.

    관심음원 제거방법 및 그에 따른 음성인식방법
    60.
    发明公开
    관심음원 제거방법 및 그에 따른 음성인식방법 有权
    有意义的音频源取消方法和语音识别方法

    公开(公告)号:KR1020130068869A

    公开(公告)日:2013-06-26

    申请号:KR1020110136285

    申请日:2011-12-16

    Inventor: 박형민 오명우

    Abstract: PURPOSE: A method for removing an interested sound source and a method for recognizing a voice are provided to estimate a mixed noise signal effectively, by removing the interested sound source from a mixed signal provided through two microphones installed in an acoustic signal mixed environment. CONSTITUTION: A voice recognition device initializes a vector(12). The device learns the vector to remove an interested sound source from a mixed signal(10). The device is initialized, and generates a mixed noise signal by removing an interested sound source signal from an input mixed signal(14). When the mixed noise signal is generated, the device generates a mask, by comparing the mixed noise signal with the input mixed signal in a time-frequency domain(16). [Reference numerals] (10) Learn a separation vector(w(K)) for separation of a target sound source; (12) Initialize the separation vector(w(K)); (14) Remove a target sound source; (16) Generate a mask using a mixed noise sound source and an input sound source

    Abstract translation: 目的:提供一种消除感兴趣的声源的方法和用于识别语音的方法,通过从通过安装在声信号混合环境中的两个麦克风提供的混合信号中去除感兴趣的声源来有效地估计混合噪声信号。 构成:语音识别装置初始化矢量(12)。 该装置学习矢量以从混合信号中去除感兴趣的声源(10)。 该装置被初始化,并且通过从输入混合信号(14)中去除感兴趣的声源信号来产生混合噪声信号。 当产生混合噪声信号时,器件通过将混合噪声信号与时频域(16)中的输入混合信号进行比较来产生掩模。 (附图标记)(10)学习用于分离目标声源的分离矢量(w(K)); (12)初始化分离向量(w(K)); (14)移除目标声源; (16)使用混合噪声声源和输入声源产生掩模

Patent Agency Ranking