전경 영역 국소화 장치 및 방법

    公开(公告)号:KR101899071B1

    公开(公告)日:2018-09-14

    申请号:KR1020160184132

    申请日:2016-12-30

    Inventor: 박형민 제창수

    Abstract: 본발명의실시예에따른영상에서전경영역을국소화하는방법은, 영상을입력받는영상입력단계와, 영상에서회색또는컬러가우스혼합모델에기반을둔 배경혼합모델을사용하여다수의전경후보픽셀을추출하는단계와, 다수의전경후보픽셀들에공간적가우스혼합모델피팅을수행하여공간적가우스혼합모델을생성하는단계와, 공간적가우스혼합모델의성분을각 성분의비중의내림차순으로정렬하는단계및 공간적가우스혼합모델의성분을정렬된순서에따라차례로, 평균이가까운두 성분을병합하는과정을마지막성분에까지반복수행하는단계를포함하여구성된다.

    전경 영역 국소화 장치 및 방법

    公开(公告)号:KR1020180078882A

    公开(公告)日:2018-07-10

    申请号:KR1020160184132

    申请日:2016-12-30

    Inventor: 박형민 제창수

    CPC classification number: G06T3/40 G06T7/194 G06T7/344 G06T2207/20221

    Abstract: 본발명의실시예에따른영상에서전경영역을국소화하는방법은, 영상을입력받는영상입력단계와, 영상에서회색또는컬러가우스혼합모델에기반을둔 배경혼합모델을사용하여다수의전경후보픽셀을추출하는단계와, 다수의전경후보픽셀들에공간적가우스혼합모델피팅을수행하여공간적가우스혼합모델을생성하는단계와, 공간적가우스혼합모델의성분을각 성분의비중의내림차순으로정렬하는단계및 공간적가우스혼합모델의성분을정렬된순서에따라차례로, 평균이가까운두 성분을병합하는과정을마지막성분에까지반복수행하는단계를포함하여구성된다.

    단일 영상으로부터 반사성분을 분리하는 방법 및 그 방법에 따른 영상처리 장치

    公开(公告)号:KR101772626B1

    公开(公告)日:2017-08-29

    申请号:KR1020160013267

    申请日:2016-02-03

    Inventor: 제창수 박형민

    Abstract: 본발명은단일영상내의반사성분을분리하는방법및 그방법에따른영상처리장치에관한것으로, 영상처리장치는, 단일영상을입력받고, 입력영상에서, 각컬러채널의반사조도(reflected irradiance) 또는각 컬러채널의광도(intensity)를상기각 컬러채널의조명(illumination)으로나누어서얻어지는혼합반사도(mixed reflectance)에서상기혼합반사도의분광적평균(mean with respect to the spectral channel index)인혼합중분(mixed neuter)을제외한잔여성분인체정분(body essence)을이용하여이색성반사성분(dichromatic reflection components)을분리하고, 이색성반사성분의분리에따라광휘(highlight) 영상과광휘가제거된영상중 하나이상을출력한다.

    3차원 기하정보를 이용한 음성 인식 방법 및 이를 이용한 음성 인식 시스템
    5.
    发明公开
    3차원 기하정보를 이용한 음성 인식 방법 및 이를 이용한 음성 인식 시스템 有权
    语音识别系统和使用3D几何信息的方法

    公开(公告)号:KR1020140100743A

    公开(公告)日:2014-08-18

    申请号:KR1020130013854

    申请日:2013-02-07

    CPC classification number: G10L15/063 G10L15/24

    Abstract: The present invention relates to a method and a system for recognizing a voice using three-dimensional geometry information. The voice recognition system comprises a learning module and a recognizing module. The learning module generates a recognition unit using three-dimensional geometry information for study and three-dimensional features for study extracted from the information. The recognizing module applies the three-dimensional geometry information acquired from a physical target related or belonged to a voice or three-dimensional features extracted from the geometry information to the recognition unit, and conducts voice recognition. The method and the system for recognizing a voice according to the present invention, recognizes a voice using three-dimensional geometry information on lips, a part around the lips, or one or more arbitrary regions of a human body in speech. Also, final voice recognition is conducted by combining two-dimensional features and sound features, and three-dimensional features and sound features in speech, and by combining recognition result of the two-dimensional features or sound features, or recognition result of the three-dimensional geometry information or three-dimensional features in speech. Therefore, the accuracy of voice recognition is improved.

    Abstract translation: 本发明涉及使用三维几何信息识别语音的方法和系统。 语音识别系统包括学习模块和识别模块。 学习模块使用三维几何信息生成识别单元,用于学习和从信息中提取的三维特征。 识别模块将从与几何信息提取的语音或三维特征相关或属于的物理目标获取的三维几何信息应用于识别单元,并进行语音识别。 根据本发明的用于识别语音的方法和系统使用在嘴唇上的三维几何信息,嘴唇周围的一部分或人体的一个或多个任意区域来识别声音。 此外,通过组合二维特征和声音特征,语音中的三维特征和声音特征,以及通过组合二维特征或声音特征的识别结果或三维特征或声音特征的识别结果来进行最终语音识别, 立体几何信息或言语中的三维特征。 因此,提高了语音识别的准确性。

    음성인식 장치 및 음성인식 장치의 동작방법

    公开(公告)号:KR102244967B1

    公开(公告)日:2021-04-27

    申请号:KR1020190068439

    申请日:2019-06-11

    Abstract: 본발명의실시예에따른음성인식학습장치는영상입력부, 영상처리부및 컨볼루션뉴럴네트워크를포함할수 있다. 영상입력부는입력영상을수신할수 있다. 영상처리부는미리정해진제1 시간간격동안의입력영상에포함되는입술영상및 입술의정해진위치에상응하는랜드마크의주변영상에해당하는패치영상을각각 N(N은자연수)개의프레임들로나눌수 있다. 컨볼루션뉴럴네트워크는입술영상을 N개의프레임들로나눈프레임입술영상및 패치영상을 N개의프레임들로나눈프레임패치영상에기초하여입술의모양에상응하는음성정보를학습할수 있다. 본발명에따른음성인식장치에서는화자의입술영상뿐만아니라, 입술의정해진위치에배치되는랜드마크의주변영상인패치영상을이용하여컨볼루션뉴럴네트워크(Convolution Neural Network, CNN)를학습시킴으로써음성인식성능을향상시킬수 있다.

    단일 영상으로부터 반사성분을 분리하는 방법 및 그 방법에 따른 영상처리 장치
    7.
    发明公开
    단일 영상으로부터 반사성분을 분리하는 방법 및 그 방법에 따른 영상처리 장치 有权
    根据该方法用于从单个图像分离反射分量的方法和图像处理设备

    公开(公告)号:KR1020170092218A

    公开(公告)日:2017-08-11

    申请号:KR1020160013267

    申请日:2016-02-03

    Inventor: 제창수 박형민

    Abstract: 본발명은단일영상내의반사성분을분리하는방법및 그방법에따른영상처리장치에관한것으로, 영상처리장치는, 단일영상을입력받고, 입력영상에서, 각컬러채널의반사조도(reflected irradiance) 또는각 컬러채널의광도(intensity)를상기각 컬러채널의조명(illumination)으로나누어서얻어지는혼합반사도(mixed reflectance)에서상기혼합반사도의분광적평균(mean with respect to the spectral channel index)인혼합중분(mixed neuter)을제외한잔여성분인체정분(body essence)을이용하여이색성반사성분(dichromatic reflection components)을분리하고, 이색성반사성분의분리에따라광휘(highlight) 영상과광휘가제거된영상중 하나이상을출력한다.

    Abstract translation: 本发明涉及一种图像处理装置,根据所述方法和所述单个图像中,图像处理装置,接收单个图像,从输入图像中,反射光强度每个颜色通道的(反射辐照度)分离的反射成分的方法或 其中,对于每个颜色通道万亿人(照明),以在所得到的混合物的反射率的混合反射率(混合反射率)光积分平均的划分分钟每个颜色通道的亮度(强度)(平均值相对于所述光谱信道索引)的混合物分钟( 使用混合中性),除了杯女士体jeongbun(体精华)到分色反射分量(二色性反射分量)的分离,这取决于分色反射分量亮度(高亮)图像的分离中的一个和一个光度被去除图像 或更多。

    최적 계층적 블록 매칭 방법 및 시스템, 이를 이용한 영상 정합 방법 및 영상 압축 방법
    8.
    发明授权
    최적 계층적 블록 매칭 방법 및 시스템, 이를 이용한 영상 정합 방법 및 영상 압축 방법 有权
    优化分层块匹配的方法与系统,基于优化分层块匹配的图像注册和视频压缩方法

    公开(公告)号:KR101550665B1

    公开(公告)日:2015-09-07

    申请号:KR1020140036362

    申请日:2014-03-27

    Inventor: 제창수 박형민

    Abstract: 본 발명에 따른 최적 계층적 블록 매칭(optimized hierarchical block matching, OHBM) 방법 및 시스템은, 계층적 블록 매칭에서, 계산량(computational cost)과 정확도(accuracy)를 최적화하도록 영상 피라미드(image pyramid)의 레이어 수(number of layers)와 두 인접 레이어(two consecutive layers) 사이의 해상도 비(scale factor), 즉 단위 해상도 비(unit scale factor)를 결정하여 계층적 블록 매칭을 수행하는 것을 특징으로 한다. 또한 본 발명에 따른 최적 계층적 블록 매칭 방법 및 시스템은 정확도를 향상시키기 위하여 두 입력 영상의 각 채널의 평균과 표준편차를 이용하여 두 입력 영상 간의 컬러 차이를 고속으로 보정하는 컬러 보정(color alignment, CA) 단계(혹은 컬러 보정부)를 더 포함하기도 한다. 또한 본 발명에 따른 영상 정합(image registration) 방법은, 두 영상에 대해 상기 최적 계층적 블록 매칭 방법 또는 시스템을 이용하여 최적 계층적 블록 매칭을 수행하고, 그 결과를 이용하여 소정의 기하 모델(geometric transformation model)에 기반을 둔 하나 이상의 기하 변환 파라미터를 추정하고, 상기 추정된 기하 변환 파라미터를 이용하여 두 입력 영상 중 하나 이상을 기하 변환하는 것을 특징으로 한다. 또한 본 발명에 따른 최적 계층적 블록 매칭을 이용한 영상 압축 방법은 영상 프레임 간 또는 스테레오스코픽 3D(stereoscopic 3D, S3D) 영상이나 다시점 3D(multiview 3D) 영상의 경우에는 좌우 영상 간 혹은 서로 다른 시점(viewpoint)의 영상 간 모션 보정을 위한 모션 추정의 속도를 획기적으로 향상시키기 위하여 상기 최적 계층적 블록 매칭 방법 또는 시스템을 이용하는 것을 특징으로 한다.

    Abstract translation: 本发明涉及优化的分层块匹配(OHBM)方法和系统,以及图像配准方法和图像压缩方法。 根据本发明的实施例的OHBM方法和系统通过确定作为两个连续层之间的比例因子的单位比例因子和图像金字塔的层数来优化精度和计算成本来执行分层块匹配 分层块匹配。

    3차원 기하정보를 이용한 음성 인식 방법 및 이를 이용한 음성 인식 시스템
    9.
    发明授权
    3차원 기하정보를 이용한 음성 인식 방법 및 이를 이용한 음성 인식 시스템 有权
    使用3D几何信息的语音识别系统和方法

    公开(公告)号:KR101442211B1

    公开(公告)日:2014-10-16

    申请号:KR1020130013854

    申请日:2013-02-07

    CPC classification number: G10L15/063 G10L15/24

    Abstract: 본 발명은 3차원 기하정보를 이용하여 음성 인식하는 방법 및 시스템에 관한 것이다. 상기 음성 인식 시스템은 학습 모듈 및 인식 모듈을 구비하여, 학습 모듈은 학습용 3차원 기하정보 또는 이들로부터 추출된 학습용 3차원 특징을 이용하여 인식기를 생성한다. 상기 인식 모듈은 음성에 연관되거나 종속된 물리적 대상로부터 획득한 3차원 기하정보 또는 이로부터 추출된 3차원 특징을 상기 인식기에 적용하여 음성 인식하는 것을 특징으로 한다.
    본 발명에 따른 음성 인식 시스템 및 방법은 발화시의 입술 및 주변, 또는 인체의 임의의 하나 이상의 영역에 대한 3차원 기하정보를 이용하여 음성 인식하는 것을 특징으로 하며, 더 나아가 발화시의 2차원 특징 또는 음향 특징과 3차원 기하정보 또는 3차원 특징을 결합하여 음성 인식하거나, 발화시의 2차원 특징 또는 음향 특징에 의한 인식 결과와 3차원 기하정보 또는 3차원 특징에 의한 인식 결과를 결합하여 최종적으로 음성 인식함으로써 음성 인식의 정확도를 향상시키는 것을 특징으로 한다.

    음성인식 장치 및 음성인식 장치의 동작방법

    公开(公告)号:KR102208536B1

    公开(公告)日:2021-01-27

    申请号:KR1020190052951

    申请日:2019-05-07

    Abstract: 본발명의실시예에따른음성인식장치는음원위치정보제공부, 영상위치정보제공부, 빔포밍위치정보제공부및 빔포밍부를포함할수 있다. 음원위치정보제공부는소리입력신호에기초하여소리입력신호에포함되는타겟음원의위치정보및 외부잡음원의위치정보를제공할수 있다. 영상위치정보제공부는영상입력신호에기초하여영상입력신호에포함되는관심음원의위치정보를제공하고, 관심음원중 사람의얼굴로판단되는얼굴영역영상을제공할수 있다. 빔포밍위치정보제공부는타겟음원의위치정보, 외부잡음원의위치정보, 관심음원의위치정보및 얼굴영역영상으로부터추출되는발화자의입술움직임정보에기초하여발화자의위치정보및 나머지음원의위치정보를제공할수 있다. 빔포밍부는발화자의위치정보및 나머지음원의위치정보에기초하여빔포밍된빔포밍소리신호를제공할수 있다. 본발명에따른음성인식장치에서는소리입력신호및 영상입력신호에기초하여생성되는발화자의위치정보및 나머지음원의위치정보에따라빔포밍하여빔포밍소리신호를제공함으로써음성인식의성능을향상시킬수 있다.

Patent Agency Ranking