스테레오 노이즈 제거 장치 및 스테레오 노이즈 제거 방법

    公开(公告)号:WO2020045898A1

    公开(公告)日:2020-03-05

    申请号:PCT/KR2019/010719

    申请日:2019-08-22

    Inventor: 박형민 조병준

    Abstract: 본 발명의 실시예에 따른 노이즈 제거 방법에서는 이전 프레임에 상응하는 제1 이전 파-엔드(Far-end) 채널필터, 제2 이전 파-엔드 채널필터 및 입력신호에 기초하여 산출되는 제1 추정 출력신호를 제공할 수 있다. 제1 추정 출력신호 및 제1 이전 파-엔드 채널필터에 따라 현재 프레임에 상응하는 제1 현재 파-엔드 채널필터를 업데이트할 수 있다. 제1 현재 파-엔드 채널필터, 제2 이전 파-엔드 채널필터 및 입력신호에 기초하여 산출되는 제2 추정 출력신호를 제공할 수 있다. 제2 추정 출력신호 및 제2 이전 파-엔드 채널필터에 따라 현재 프레임에 상응하는 제2 현재 파-엔드 채널필터를 업데이트할 수 있다. 제1 현재 파-엔드 채널필터, 제2 현재 파-엔드 채널필터 및 입력신호에 기초하여 산출되는 결과신호를 제공할 수 있다. 본 발명에 따른 노이즈 제거 방법을 사용하면 입력신호로부터 스테레오 에코 신호를 제거함으로써 노이즈가 제거된 음성신호를 제공할 수 있다.

    코골이 감지 및 개선 기능을 갖는 베개 시스템

    公开(公告)号:WO2023038312A1

    公开(公告)日:2023-03-16

    申请号:PCT/KR2022/012169

    申请日:2022-08-16

    Abstract: 본 발명은 코골이 감지 및 개선 기능을 갖는 베개 시스템에 관한 것이다. 보다 구체적으로, 본 발명의 일 실시예에 따른 코골이 감지 및 개선 기능을 갖는 베개 시스템은, 내부 공기압이 조절되어 사용자의 머리를 이동 또는 회전시키는 베개(200); 및 상기 베개(200)와 연결되며, 미리 설정된 사용자의 위치 정보에 기초하여 사용자의 코골이 소리를 감지하고, 상기 감지된 코골이 소리에 따라 상기 베개(200)의 내부 공기압을 조절하는 구동신호를 발생시키는 솔루션 박스(100)를 포함할 수 있다.

    동영상 기반 행동인식 장치 및 이의 동작방법

    公开(公告)号:WO2022163972A1

    公开(公告)日:2022-08-04

    申请号:PCT/KR2021/015513

    申请日:2021-11-01

    Abstract: 본 발명의 실시예에 따른 동영상 기반 행동인식 장치의 동작방법에서는, 합성 채널 프레임 제공부가 복수의 채널들 중 각 채널에 상응하는 채널 프레임들을 비교하여 하이라이트 정보를 생성하고, 채널 프레임들과 하이라이트 정보를 합성하여 합성 채널 프레임을 제공할 수 있다. 뉴럴 네트워크부가 합성 채널 프레임 및 멀티프레임 컨볼루션 뉴럴네트워크에 기초하여 중간 프레임를 제공할 수 있다. 행동인식 결과 제공부가 중간 프레임에 따라 생성되는 가중치 값 및 중간 프레임에 기초하여 행동인식 결과를 제공할 수 있다. 본 발명에 따른 동영상 기반 행동인식 장치의 동작방법에서는, 채널별로 제공되는 채널 프레임들로부터 합성되는 합성 채널 프레임 및 멀티프레임 컨볼루션 뉴럴네트워크에 기초하여 행동인식 결과를 제공함으로써 동영상 내의 이벤트 발생을 보다 효과적으로 검출할 수 있다.

    선택적 주의 집중 모델을 이용한 모니터링 장치 및 그 모니터링 방법
    4.
    发明申请
    선택적 주의 집중 모델을 이용한 모니터링 장치 및 그 모니터링 방법 审中-公开
    使用选择性注意模型的监视装置和用于监视其的方法

    公开(公告)号:WO2013085278A1

    公开(公告)日:2013-06-13

    申请号:PCT/KR2012/010480

    申请日:2012-12-05

    Abstract: 모니터링 장치가 개시된다. 본 모니터링 장치는, 이격된 위치에서 촬영된 복수의 이미지 및 이격된 위치에서 청취된 복수의 음원을 입력받는 입력부, 복수의 이미지 각각에 대한 복수의 모노 돌출맵을 생성하고, 생성된 복수의 모노 돌출맵을 이용하여 동적 돌출맵을 생성하는 돌출맵 생성부, 복수의 음원을 분석하여 음원의 위치를 판단하는 위치 판단부, 생성된 동적 돌출맵 및 판단된 음원 위치를 기초로 복수의 이미지에 대한 경로를 생성하는 시선 경로 인식부 및 생성된 시선 경로를 출력하는 출력부를 포함한다.

    Abstract translation: 本发明涉及监视装置。 本监视装置包括:用于接收在分离位置听到的多个声源的输入单元和在分开的位置捕获的多个图像; 显着图生成单元,分别通过使用所生成的单体显着图生成分别用于多个图像的多个单显显示图和动态显着图; 位置确定单元,用于分析所述多个声源以确定所述声源的位置; 基于生成的动态显着图和确定的声源位置,生成用于生成多个图像的路径的视线路径的识别单元; 以及用于输出生成的视线路径的输出单元。

    음성인식 장치 및 음성인식 장치의 동작방법

    公开(公告)号:KR102208536B1

    公开(公告)日:2021-01-27

    申请号:KR1020190052951

    申请日:2019-05-07

    Abstract: 본발명의실시예에따른음성인식장치는음원위치정보제공부, 영상위치정보제공부, 빔포밍위치정보제공부및 빔포밍부를포함할수 있다. 음원위치정보제공부는소리입력신호에기초하여소리입력신호에포함되는타겟음원의위치정보및 외부잡음원의위치정보를제공할수 있다. 영상위치정보제공부는영상입력신호에기초하여영상입력신호에포함되는관심음원의위치정보를제공하고, 관심음원중 사람의얼굴로판단되는얼굴영역영상을제공할수 있다. 빔포밍위치정보제공부는타겟음원의위치정보, 외부잡음원의위치정보, 관심음원의위치정보및 얼굴영역영상으로부터추출되는발화자의입술움직임정보에기초하여발화자의위치정보및 나머지음원의위치정보를제공할수 있다. 빔포밍부는발화자의위치정보및 나머지음원의위치정보에기초하여빔포밍된빔포밍소리신호를제공할수 있다. 본발명에따른음성인식장치에서는소리입력신호및 영상입력신호에기초하여생성되는발화자의위치정보및 나머지음원의위치정보에따라빔포밍하여빔포밍소리신호를제공함으로써음성인식의성능을향상시킬수 있다.

    음성인식 장치 및 음성인식 장치의 동작방법

    公开(公告)号:KR1020200129219A

    公开(公告)日:2020-11-18

    申请号:KR1020190052951

    申请日:2019-05-07

    Abstract: 본발명의실시예에따른음성인식장치는음원위치정보제공부, 영상위치정보제공부, 빔포밍위치정보제공부및 빔포밍부를포함할수 있다. 음원위치정보제공부는소리입력신호에기초하여소리입력신호에포함되는타겟음원의위치정보및 외부잡음원의위치정보를제공할수 있다. 영상위치정보제공부는영상입력신호에기초하여영상입력신호에포함되는관심음원의위치정보를제공하고, 관심음원중 사람의얼굴로판단되는얼굴영역영상을제공할수 있다. 빔포밍위치정보제공부는타겟음원의위치정보, 외부잡음원의위치정보, 관심음원의위치정보및 얼굴영역영상으로부터추출되는발화자의입술움직임정보에기초하여발화자의위치정보및 나머지음원의위치정보를제공할수 있다. 빔포밍부는발화자의위치정보및 나머지음원의위치정보에기초하여빔포밍된빔포밍소리신호를제공할수 있다. 본발명에따른음성인식장치에서는소리입력신호및 영상입력신호에기초하여생성되는발화자의위치정보및 나머지음원의위치정보에따라빔포밍하여빔포밍소리신호를제공함으로써음성인식의성능을향상시킬수 있다.

Patent Agency Ranking