영상 처리 방법
    11.
    发明授权

    公开(公告)号:KR101739025B1

    公开(公告)日:2017-05-24

    申请号:KR1020120025660

    申请日:2012-03-13

    Abstract: 입력영상에서전경영상과배경영상을분리하는영상처리방법이개시된다. 본발명의실시예에따른영상처리방법은, 단계들 (a) 내지 (d)를포함한다. 단계 (a)에서는, 입력영상의화소들각각에대하여, 가우시안(Gaussian) 혼합모델에의하여전경영상의화소인지또는배경영상의화소인지가판단된다. 단계 (b)에서는, 입력영상의화소들각각에대하여, 움직임영역에포함되었는지가판단된다. 단계 (c)에서는, 입력영상의화소들각각에대하여, 입력영상의기준영상과입력영상의상관도에대한전경확률히스토그램에따라, 전경확률값이구해진다. 단계 (d)에서는, 입력영상의화소들각각에대하여, 가우시안(Gaussian) 혼합모델에의하여판단된전경영상의화소, 또는움직임영역에포함되었다고판단된화소의전경확률값이설정문턱값 이상이면, 전경영상의화소로서판단된다.

    음향 정보 기반 상황 인식 장치 및 방법
    12.
    发明授权
    음향 정보 기반 상황 인식 장치 및 방법 有权
    基于声学信息的情况识别装置和方法

    公开(公告)号:KR101736466B1

    公开(公告)日:2017-05-16

    申请号:KR1020120019178

    申请日:2012-02-24

    Abstract: 본발명은음향정보기반상황인식장치및 방법을개시한다. 본발명의음향정보기반상황인식장치는, 입력되는음향신호에서 MFCC 특징및 Timbre 특징을음향특징으로추출하는특징추출부와, 복수의음성이벤트와비음성이벤트를포함하는복수의음향이벤트에대하여훈련에의해미리획득된기준음향특징과상기음향신호의 MFCC 특징및 Timbre 특징간의유사도를계산하여상기음향특징을평가하는특징평가부와, 상기음향신호의음향특징과상기기준음향특징간의유사도를기초로, 상기음향신호를계층적접근방식에의해상기복수의음향이벤트중 하나로분류하는음향분류부를포함할수 있다.

    Abstract translation: 本发明公开了一种基于声学信息的情况识别设备和方法。 本发明的基于声学信息的情况识别装置包括:特征提取单元,用于从输入声学信号中提取MFCC特征和音色特征作为声学特征;以及多个声学事件,包括多个音频事件, 特征评估单元,用于计算预先获取的参考声学特征和MFCC特征与声学信号的音色特征之间的相似性,以评估声学特征; 以及声音分类单元,用于通过分层方式将声音信号分类为多个声音事件中的一个。

    영상 처리 방법 및 장치
    13.
    发明授权
    영상 처리 방법 및 장치 有权
    用于处理图像的方法和装置

    公开(公告)号:KR101583430B1

    公开(公告)日:2016-01-19

    申请号:KR1020140130671

    申请日:2014-09-30

    Inventor: 고한석 박두복

    CPC classification number: G06T5/008 G06T7/44 G06T2207/10004 G06T2207/20021

    Abstract: 본발명은안개로인해화질이저하된영상의화질을개선할수 있는영상처리방법및 장치에대한것이다. 본발명의일실시예에의한영상처리방법은그레이(gray) 영상으로변환된입력영상을소정개수의블록으로분할하고, 상기분할된각 블록에대해최소값필터링을수행하여, 상기각 블록에대해지역적산란광을추정하는단계-상기최소값필터링은상기각 블록의최소픽셀값을상기각 블록의대표값으로지정하는것을의미함-; 상기각 블록에대해영상엔트로피를포함하는목적함수를최대화하는전달량을추정하는단계-상기영상엔트로피는영상에서화소값의분포정도를나타내는값으로전달량을변수로포함함-; 및상기추정된지역적산란광및 전달량을이용하여상기입력영상을복원하는단계를포함할수 있다.

    Abstract translation: 本发明涉及一种能够提高灰雾劣化的图像质量的图像处理方法和图像处理装置。 根据本发明的实施例,图像处理方法可以包括以下步骤:将已经被转换成灰度图像的输入图像划分成预定数量的块并且通过执行最小值来估计每个块的局部散射光 对每个划分的块进行滤波 - 最小值滤波装置将每个块的最小像素值设置为每个块的代表值; 估计使包括每个块的图像熵的目标函数值最大化的传输量 - 图像熵是表示图像中的像素值的色散程度的值,并将传输值包括为变量; 以及通过使用估计的局部散射光和估计的透射量来恢复输入图像。

    적응 빔포밍을 위한 사용자 방향의 소리 검출 기반의 적응모드 제어 장치 및 방법
    14.
    发明授权
    적응 빔포밍을 위한 사용자 방향의 소리 검출 기반의 적응모드 제어 장치 및 방법 有权
    自适应模式控制器和自适应波束形成方法,基于探测到扬声器方向的所需声音

    公开(公告)号:KR101470528B1

    公开(公告)日:2014-12-15

    申请号:KR1020080053810

    申请日:2008-06-09

    CPC classification number: G10K11/178 G10K2210/111

    Abstract: 본발명에따른적응빔포밍을위한사용자방향의소리검출기반의적응모드제어장치는 Adaptive beamformer 처리부로제공하는적어도하나이상의마이크로폰을통해입력된어레이입력신호를입력받으면, 각각의지정된방향의신호세기를검색하여최대값을갖는신호세기를검출하는신호세기검출부; 및상기신호세기검출부를통해검출된최대값을갖는신호세기와임계값을비교하여최대값을갖는신호세기가임계값을초과할경우 GSC의 adaptive 모드를수행하지않도록제어하는 adaptive 모드제어부를포함하는것으로적응빔포밍이성능을보장하기위한조건중에하나이나, 자기상관도가높은음원의잡음을제거할경우적응필터의적응을적용하지않아야하나이를제어할수 없는종래의문제점을해결하는이점이있다.

    얼굴 검출 장치
    15.
    发明授权

    公开(公告)号:KR101415325B1

    公开(公告)日:2014-07-08

    申请号:KR1020090077609

    申请日:2009-08-21

    Abstract: 본 발명은 입력영상에서 적분영상 및 엣지영상을 각각 구하고 그로부터 할-라이크 특징 정보 및 EOH 특징 정보를 추출하고 추출된 정보들을 조합하여 얼굴을 검출하는 얼굴 검출 장치에 관한 것이다. 얼굴 검출 장치는 입력영상으로부터 적분영상 및 엣지영상을 생성하고, 기 저장된 학습 데이터를 이용하여 상기 적분영상으로부터 할-라이크(Haar-like) 특징 정보를 추출하고, 상기 엣지영상으로부터 EOH(Edge of Orientation Histogram) 특징 정보를 추출하는 특징정보 추출수단; 및 상기 조합된 할-라이크 특징 정보 및 EOH 특징 정보에 아다부스트 알고리즘을 적용하여 얼굴을 검출하는 얼굴 검출수단을 포함한다.
    할-라이크 특징값 추출, EOH 특징값 추출, 특징값 조합, 아다부스트 알고리즘

    잡음 제거 장치 및 방법
    16.
    发明公开
    잡음 제거 장치 및 방법 有权
    消除噪音的装置和方法

    公开(公告)号:KR1020130127597A

    公开(公告)日:2013-11-25

    申请号:KR1020120051243

    申请日:2012-05-15

    CPC classification number: G10L21/0232 G10L25/87 H04R3/04

    Abstract: A noise-canceling device and a method thereof are disclosed. The disclosed noise-canceling device is a device which removes noises in the signals inputted to multiple voice input devices and comprises a phase difference calculation part calculating a phase difference between a first signal and a second signal inputted to a first voice input device and a second voice input device, respectively; a size difference calculation part extracting noise components from the first signal and the second signal and calculating a size difference between the extracted noise component and the first signal; and a noise-canceling coefficient calculation part calculating a noise-canceling coefficient using the phase difference and the size difference. In accordance with the present invention, an error rate can be reduced by removing the signals having undesired directivity as noise from the signals inputted to the voice input devices, and the divergence or convergence rate of output does not fail due to the convergence of the problems of an adaptive filter by not using the adaptive filter. [Reference numerals] (100) Noise removing device;(AA) Determine voice components;(BB) Apply a fuzzy rule;(CC) Calculate a noise-canceling coefficient;(DD) Reflect a noise-canceling coefficient and perform inverse transformation;(EE) Final output;(FF) Calculate the size difference;(GG) Calculate the phase difference

    Abstract translation: 公开了一种噪声消除装置及其方法。 所公开的噪声消除装置是去除输入到多个语音输入装置的信号中的噪声的装置,包括计算第一信号和输入到第一语音输入装置的第二信号之间的相位差的相位差计算部, 语音输入设备; 尺寸差分计算部分从第一信号和第二信号中提取噪声分量,并计算提取的噪声分量与第一信号之间的尺寸差; 以及噪声消除系数计算部分,使用相位差和尺寸差来计算噪声消除系数。 根据本发明,可以通过从输入到语音输入装置的信号中去除具有不期望的方向性的信号作为噪声,并且由于问题的收敛而导致的输出的发散或收敛速度不会失败,可以降低错误率 的自适应滤波器。 (100)噪声去除装置(AA)确定声音成分;(BB)应用模糊规则;(CC)计算消噪系数;(DD)反映噪声消除系数并进行逆变换; (EE)最终输出;(FF)计算尺寸差;(GG)计算相位差

    영상 처리 방법
    17.
    发明公开
    영상 처리 방법 有权
    处理图像的方法

    公开(公告)号:KR1020130104286A

    公开(公告)日:2013-09-25

    申请号:KR1020120025660

    申请日:2012-03-13

    Abstract: PURPOSE: An image processing method is provided to obtain a foreground probability value based on a foreground probability histogram about a correlation between a standard image of an input image and the input image, thereby improving the accuracy of separation and being robust in an environment such as the inside of an elevator. CONSTITUTION: Whether each pixel of an input image is a pixel of a foreground image or a pixel of a background image is determined by a Gaussian mixture model (S21). Whether each pixel is included in a motion area is determined (S22). With regard to each pixel, a foreground probability value is obtained based on a foreground probability histogram about a correlation between a standard image of the input image and the input image (S23). If the foreground probability value of a pixel of the examined foreground image or a pixel in the motion area is above a given threshold value, the pixel is determined as a pixel of the foreground image (S24). [Reference numerals] (AA) Start; (BB) No; (CC) Yes; (DD) End; (S21) Whether each pixel of an input image is a pixel of a foreground image or a pixel of a background image is determined by a Gaussian mixture model; (S22) Whether each pixel is included in a motion area is determined; (S23) With regard to each pixel, a foreground probability value is obtained based on a foreground probability histogram about a correlation between a standard image of the input image and the input image; (S24) If the foreground probability value of a pixel of the examined foreground image or a pixel in the motion area is above a given threshold value, the pixel is determined as a pixel of the foreground image; (S25) Standard image is updated; (S26) Is there an ending signal ?

    Abstract translation: 目的:提供一种图像处理方法,用于基于关于输入图像的标准图像与输入图像之间的相关性的前景概率直方图来获得前景概率值,从而提高分离的准确度并且在诸如 电梯里面。 构成:通过高斯混合模型确定输入图像的每个像素是前景图像的像素还是背景图像的像素(S21)。 确定每个像素是否包括在运动区域中(S22)。 对于每个像素,基于关于输入图像的标准图像与输入图像之间的相关性的前景概率直方图来获得前景概率值(S23)。 如果所检查的前景图像的像素的前景概率值或运动区域中的像素高于给定阈值,则将像素确定为前景图像的像素(S24)。 (附图标记)(AA)开始; (BB)否 (CC)是; (DD)结束; (S21)通过高斯混合模型确定输入图像的每个像素是前景图像的像素还是背景图像的像素; (S22)确定每个像素是否包括在运动区域中; (S23)关于每个像素,基于关于输入图像的标准图像与输入图像之间的相关性的前景概率直方图来获得前景概率值; (S24)如果所检查的前景图像的像素的前景概率值或运动区域中的像素的前景概率值高于给定的阈值,则将像素确定为前景图像的像素; (S25)标准图像更新; (S26)是否有结束信号?

    마이크로폰 어레이를 이용한 사용자 음성 인식 장치 및 그 마이크로폰 어레이 구동 방법
    18.
    发明公开
    마이크로폰 어레이를 이용한 사용자 음성 인식 장치 및 그 마이크로폰 어레이 구동 방법 有权
    使用麦克风阵列识别语音的装置和驱动麦克风阵列的方法

    公开(公告)号:KR1020080073516A

    公开(公告)日:2008-08-11

    申请号:KR1020070012222

    申请日:2007-02-06

    Abstract: A voice recognition apparatus for recognizing a voice by using a microphone array and a microphone array driving method thereof are provided to mount the microphone array in an endfire type, and protrude the microphone array if a user is recognized, thereby suppressing surrounding noise through the microphone array and receiving a voice signal more accurately. A voice recognition apparatus includes a microphone array(504), a microphone array mounting unit(502), a microphone array driver(506), a beam forming unit(508), a control unit(500), and a memory unit(510). The microphone array is composed of at least one microphone, and is mounted in an endfire type to the voice recognition apparatus to receive a voice in an endfire direction. The microphone array mounting unit mounts the microphone array. The microphone array mounting unit protrudes or mounts the microphone array according to a control signal for driving the microphone array. The control unit outputs the control signal for protruding the microphone array to the microphone array mounting unit if a user is recognized.

    Abstract translation: 提供了一种用于通过使用麦克风阵列和麦克风阵列驱动方法来识别语音的语音识别装置,以将麦克风阵列安装在端射型中,并且如果用户被识别则突出麦克风阵列,从而通过麦克风抑制周围的噪声 阵列并更准确地接收语音信号。 语音识别装置包括麦克风阵列(504),麦克风阵列安装单元(502),麦克风阵列驱动器(506),波束形成单元(508),控制单元(500)和存储单元 )。 麦克风阵列由至少一个麦克风组成,并且以端火类型安装到语音识别装置以在端射方向上接收声音。 麦克风阵列安装单元安装麦克风阵列。 麦克风阵列安装单元根据用于驱动麦克风阵列的控制信号突出或安装麦克风阵列。 如果用户被识别,则控制单元输出用于将麦克风阵列突出到麦克风阵列安装单元的控制信号。

    멀티음성채널 음성신호의 적응적 잡음제거를 위한 전처리 방법 및 장치
    19.
    发明授权
    멀티음성채널 음성신호의 적응적 잡음제거를 위한 전처리 방법 및 장치 失效
    在多语音信道上自适应去除语音信号噪声的预处​​理方法和装置

    公开(公告)号:KR100751927B1

    公开(公告)日:2007-08-24

    申请号:KR1020050108238

    申请日:2005-11-11

    Inventor: 고한석 김기현

    Abstract: 멀티음성채널 음성신호의 적응적 잡음제거를 위한 전처리 방법 및 장치가 개시된다. 그 전처리 장치는 멀티음성채널의 각 입력채널별로 매 프레임의 채널신호 평균이득(RMS) 값을 계산하는 평균이득 계산부; 상기 평균이득 계산부에서 계산된 평균이득을 이용하여 상기 입력채널 간의 상대적인 평균이득비를 계산하는 이득비추정부; 및 상기 이득비 추정부에서 계산된 평균이득비의 역을 이용하여 상기 입력채널별로 입력신호를 보정하는 이득비역보상부를 포함함을 특징으로 한다.
    본 발명에 의하면, 전체 시스템의 잡음 제거 성능을 향상 할 수 있다. 또한 잡음 제거의 모든 과정이 시간 도메인에서 처리되도록 함으로써 매 샘플마다 잡음 추정 과정을 진행할 수 있으며, 실시간적용에 적합한 작은 계산량을 갖는다. 추가로 잘못된 이득 비 추정에 대한 제한을 둠으로써 기존 GSC의 성능을 저해하는 것을 방지한다.

    잡음환경에 강인한 음성인식을 위한 에너지 특징 보상 방법및 장치
    20.
    发明授权
    잡음환경에 강인한 음성인식을 위한 에너지 특징 보상 방법및 장치 失效
    用于补偿噪声环境中鲁棒语音识别的能量特征的方法和装置

    公开(公告)号:KR100751923B1

    公开(公告)日:2007-08-24

    申请号:KR1020050108236

    申请日:2005-11-11

    Inventor: 고한석 이윤재

    Abstract: 잡음환경에 강인한 음성인식을 위한 에너지 특징 보상 방법 및 장치가 개시된다. 그 에너지 특징 보상 방법은 (a) 잡음이 없는 깨끗한 환경에서 수집한 음성 훈련데이터의 에너지 특징을 잡음환경의 에너지와 유사한 환경으로 변환시키는 단계; (b) 인식 음성데이터의 에너지 최소값이 소정의 목표 최소값보다 큰지 체크하여, 상기 음성데이터의 에너지 최소값이 상기 목표 최소값보다 작으면, 에너지의 최소값과 최대값의 중간값 이하만 ERN 변환식에 의해 변환시키는 Half-ERN을 수행하는 단계; 및 (c) 인식 음성데이터의 에너지 최소값이 목표 최소값보다 작지 않으면 에너지 특징을 소정의 방법으로 보상하는 단계를 포함함을 특징으로 한다.
    본 발명에 의하면, 보다 다양한 환경에 더욱 강인한 에너지 특징 보상이 가능하게 되어 잡음 환경에서의 음성 인식률을 향상시킬 수 있다.

Patent Agency Ranking