스테레오 노이즈 제거 장치 및 스테레오 노이즈 제거 방법

    公开(公告)号:WO2020045898A1

    公开(公告)日:2020-03-05

    申请号:PCT/KR2019/010719

    申请日:2019-08-22

    Inventor: 박형민 조병준

    Abstract: 본 발명의 실시예에 따른 노이즈 제거 방법에서는 이전 프레임에 상응하는 제1 이전 파-엔드(Far-end) 채널필터, 제2 이전 파-엔드 채널필터 및 입력신호에 기초하여 산출되는 제1 추정 출력신호를 제공할 수 있다. 제1 추정 출력신호 및 제1 이전 파-엔드 채널필터에 따라 현재 프레임에 상응하는 제1 현재 파-엔드 채널필터를 업데이트할 수 있다. 제1 현재 파-엔드 채널필터, 제2 이전 파-엔드 채널필터 및 입력신호에 기초하여 산출되는 제2 추정 출력신호를 제공할 수 있다. 제2 추정 출력신호 및 제2 이전 파-엔드 채널필터에 따라 현재 프레임에 상응하는 제2 현재 파-엔드 채널필터를 업데이트할 수 있다. 제1 현재 파-엔드 채널필터, 제2 현재 파-엔드 채널필터 및 입력신호에 기초하여 산출되는 결과신호를 제공할 수 있다. 본 발명에 따른 노이즈 제거 방법을 사용하면 입력신호로부터 스테레오 에코 신호를 제거함으로써 노이즈가 제거된 음성신호를 제공할 수 있다.

    코골이 감지 및 개선 기능을 갖는 베개 시스템

    公开(公告)号:WO2023038312A1

    公开(公告)日:2023-03-16

    申请号:PCT/KR2022/012169

    申请日:2022-08-16

    Abstract: 본 발명은 코골이 감지 및 개선 기능을 갖는 베개 시스템에 관한 것이다. 보다 구체적으로, 본 발명의 일 실시예에 따른 코골이 감지 및 개선 기능을 갖는 베개 시스템은, 내부 공기압이 조절되어 사용자의 머리를 이동 또는 회전시키는 베개(200); 및 상기 베개(200)와 연결되며, 미리 설정된 사용자의 위치 정보에 기초하여 사용자의 코골이 소리를 감지하고, 상기 감지된 코골이 소리에 따라 상기 베개(200)의 내부 공기압을 조절하는 구동신호를 발생시키는 솔루션 박스(100)를 포함할 수 있다.

    동영상 기반 행동인식 장치 및 이의 동작방법

    公开(公告)号:WO2022163972A1

    公开(公告)日:2022-08-04

    申请号:PCT/KR2021/015513

    申请日:2021-11-01

    Abstract: 본 발명의 실시예에 따른 동영상 기반 행동인식 장치의 동작방법에서는, 합성 채널 프레임 제공부가 복수의 채널들 중 각 채널에 상응하는 채널 프레임들을 비교하여 하이라이트 정보를 생성하고, 채널 프레임들과 하이라이트 정보를 합성하여 합성 채널 프레임을 제공할 수 있다. 뉴럴 네트워크부가 합성 채널 프레임 및 멀티프레임 컨볼루션 뉴럴네트워크에 기초하여 중간 프레임를 제공할 수 있다. 행동인식 결과 제공부가 중간 프레임에 따라 생성되는 가중치 값 및 중간 프레임에 기초하여 행동인식 결과를 제공할 수 있다. 본 발명에 따른 동영상 기반 행동인식 장치의 동작방법에서는, 채널별로 제공되는 채널 프레임들로부터 합성되는 합성 채널 프레임 및 멀티프레임 컨볼루션 뉴럴네트워크에 기초하여 행동인식 결과를 제공함으로써 동영상 내의 이벤트 발생을 보다 효과적으로 검출할 수 있다.

    선택적 주의 집중 모델을 이용한 모니터링 장치 및 그 모니터링 방법
    4.
    发明申请
    선택적 주의 집중 모델을 이용한 모니터링 장치 및 그 모니터링 방법 审中-公开
    使用选择性注意模型的监视装置和用于监视其的方法

    公开(公告)号:WO2013085278A1

    公开(公告)日:2013-06-13

    申请号:PCT/KR2012/010480

    申请日:2012-12-05

    Abstract: 모니터링 장치가 개시된다. 본 모니터링 장치는, 이격된 위치에서 촬영된 복수의 이미지 및 이격된 위치에서 청취된 복수의 음원을 입력받는 입력부, 복수의 이미지 각각에 대한 복수의 모노 돌출맵을 생성하고, 생성된 복수의 모노 돌출맵을 이용하여 동적 돌출맵을 생성하는 돌출맵 생성부, 복수의 음원을 분석하여 음원의 위치를 판단하는 위치 판단부, 생성된 동적 돌출맵 및 판단된 음원 위치를 기초로 복수의 이미지에 대한 경로를 생성하는 시선 경로 인식부 및 생성된 시선 경로를 출력하는 출력부를 포함한다.

    Abstract translation: 本发明涉及监视装置。 本监视装置包括:用于接收在分离位置听到的多个声源的输入单元和在分开的位置捕获的多个图像; 显着图生成单元,分别通过使用所生成的单体显着图生成分别用于多个图像的多个单显显示图和动态显着图; 位置确定单元,用于分析所述多个声源以确定所述声源的位置; 基于生成的动态显着图和确定的声源位置,生成用于生成多个图像的路径的视线路径的识别单元; 以及用于输出生成的视线路径的输出单元。

    음성인식 장치 및 음성인식 장치의 동작방법

    公开(公告)号:KR102208536B1

    公开(公告)日:2021-01-27

    申请号:KR1020190052951

    申请日:2019-05-07

    Abstract: 본발명의실시예에따른음성인식장치는음원위치정보제공부, 영상위치정보제공부, 빔포밍위치정보제공부및 빔포밍부를포함할수 있다. 음원위치정보제공부는소리입력신호에기초하여소리입력신호에포함되는타겟음원의위치정보및 외부잡음원의위치정보를제공할수 있다. 영상위치정보제공부는영상입력신호에기초하여영상입력신호에포함되는관심음원의위치정보를제공하고, 관심음원중 사람의얼굴로판단되는얼굴영역영상을제공할수 있다. 빔포밍위치정보제공부는타겟음원의위치정보, 외부잡음원의위치정보, 관심음원의위치정보및 얼굴영역영상으로부터추출되는발화자의입술움직임정보에기초하여발화자의위치정보및 나머지음원의위치정보를제공할수 있다. 빔포밍부는발화자의위치정보및 나머지음원의위치정보에기초하여빔포밍된빔포밍소리신호를제공할수 있다. 본발명에따른음성인식장치에서는소리입력신호및 영상입력신호에기초하여생성되는발화자의위치정보및 나머지음원의위치정보에따라빔포밍하여빔포밍소리신호를제공함으로써음성인식의성능을향상시킬수 있다.

    음성인식 장치 및 음성인식 장치의 동작방법

    公开(公告)号:KR1020200129219A

    公开(公告)日:2020-11-18

    申请号:KR1020190052951

    申请日:2019-05-07

    Abstract: 본발명의실시예에따른음성인식장치는음원위치정보제공부, 영상위치정보제공부, 빔포밍위치정보제공부및 빔포밍부를포함할수 있다. 음원위치정보제공부는소리입력신호에기초하여소리입력신호에포함되는타겟음원의위치정보및 외부잡음원의위치정보를제공할수 있다. 영상위치정보제공부는영상입력신호에기초하여영상입력신호에포함되는관심음원의위치정보를제공하고, 관심음원중 사람의얼굴로판단되는얼굴영역영상을제공할수 있다. 빔포밍위치정보제공부는타겟음원의위치정보, 외부잡음원의위치정보, 관심음원의위치정보및 얼굴영역영상으로부터추출되는발화자의입술움직임정보에기초하여발화자의위치정보및 나머지음원의위치정보를제공할수 있다. 빔포밍부는발화자의위치정보및 나머지음원의위치정보에기초하여빔포밍된빔포밍소리신호를제공할수 있다. 본발명에따른음성인식장치에서는소리입력신호및 영상입력신호에기초하여생성되는발화자의위치정보및 나머지음원의위치정보에따라빔포밍하여빔포밍소리신호를제공함으로써음성인식의성능을향상시킬수 있다.

    독립 벡터 분석 및 반향 필터 재추정을 이용한 베이시안 특징 향상에 의한 강인한 음성 인식 장치 및 방법

    公开(公告)号:KR101802444B1

    公开(公告)日:2017-11-29

    申请号:KR1020160089966

    申请日:2016-07-15

    Inventor: 박형민 조지원

    Abstract: 본발명은독립벡터분석및 재추정된반향필터파라메터를이용한베이시안특징향상시킨음성인식장치및 방법에관한것이다. 상기음성인식방법은, (a) 외부로부터입력된복수개의음성신호들을단구간푸리에변환하여각각주파수영역의신호로변환하여출력하는단계; (b) 상기주파수영역의음성신호들을독립벡터분석하여 IVA 타겟음성신호와 IVA 노이즈신호를추정하는단계; (c) 상기독립벡터분석에의해추정된 IVA 타겟음성신호로부터 HMM-based BFE 하여음성특징을추출하는단계; (d) 상기 IVA 타겟음성신호를이용하여상기독립벡터분석에의해추정된 IVA 노이즈신호를스케일링한후 스케일링된 IVA 노이즈신호로부터노이즈특징을추출하는단계; (e) 상기음성특징및 반향필터파라메터의초기설정값을이용하여 HMM-based BFE 하여음성특징을강화시켜초기음원신호를추정하는단계; (f) 상기노이즈특징과상기추정된초기음원신호를이용하여반향필터파라메터를재추정하는단계; (g) 상기재추정된반향필터파라메터를이용하여상기음성특징을다시강화시켜음원신호를최종추정하는단계; 를구비한다.

    마우스맵을 이용한 능동형태모델 기반 입술 형태 추정 방법 및 시스템
    10.
    发明授权
    마우스맵을 이용한 능동형태모델 기반 입술 형태 추정 방법 및 시스템 有权
    基于主动形状模型的LIP形状估计方法和使用路径映射的系统

    公开(公告)号:KR101621304B1

    公开(公告)日:2016-05-16

    申请号:KR1020140178965

    申请日:2014-12-12

    CPC classification number: G06T7/0002 G06T7/0004 G06T7/155 G06T7/75 G06T7/90

    Abstract: 본발명은마우스맵을이용한능동형태모델기반입술형태추정방법및 시스템에관한것으로서, 보다바람직하게는얼굴검출부가외부로부터입력받은영상내 얼굴영역을검출하는단계; 마우스맵변환부가마우스맵(mouth map)을통해초기형태의입술영역을변환하고, 변환된초기형태의입술영역을앞서검출한상기얼굴영역내 존재하는입술영역의상부에중첩시켜적어도하나의랜드마크(landmark)를생성하는단계; 위치검색부가상기랜드마크에대한능동형태모델을생성하기위한최적의위치를검색하는단계; 능동형태모델생성부가검색된최적의위치로상기랜드마크를이동시켜상기랜드마크에대한능동형태모델을생성하는단계; 및주성분표시부가상기적어도하나의랜드마크에대한능동형태모델을정렬하여상기능동형태모델별주성분(principal components) 정보를표시하는단계; 및영상표시부가상기랜드마크에대한능동형태모델을영상으로표현하여상기입력받은영상내 입술형태를추정하는단계;를포함한다. 이러한구성에의해, 본발명의마우스맵을이용한능동형태모델기반입술형태추정시스템은영상속 얼굴또는그 일부에대해색차(chrominance) 성분을이용하여입술등 붉은영역이도드라지게하는마우스맵을사용하여컬러영상으로부터마우스맵을얻고, 이들능동형태모델에적용하여입술형태를보다정확하게추정할수 있는효과가있다.

    Abstract translation: 本发明涉及一种基于活动形式模型的唇形估计方法和使用口图的系统,更期望地包括:面部检测单元检测从外部输入的图像内的面部区域的步骤; 口图转换单元通过口贴图转换初级形状的唇部区域,并通过将检测到的脸部区域中的唇部区域的上侧的主要形状的唇部区域重叠而产生一个或多个界标的步骤; 位置搜索单元搜索最佳位置以产生关于地标的活动形式模型的步骤; 活动形式模型生产单元通过将地标移动到搜索到的最佳位置来产生关于地标的活动形式模型的步骤; 主成分显示单元通过主动形式模型显示关于至少一个地标的活动形式模型来显示主成分信息的步骤; 以及图像显示单元将关于地标的活动形式模型表示为图像并估计输入图像内的唇形的步骤。 通过该组合,使用本发明的口图的基于活动形状模型的唇形估计方法系统可以通过使用口贴图来获得口图,该口贴图通过使用唇形等来读取区域 关于图像或其一部分中的面部的色度分量,并且可以通过将口图应用于活动形式模型来准确地估计唇部形状。

Patent Agency Ranking