스테레오 노이즈 제거 장치 및 스테레오 노이즈 제거 방법

    公开(公告)号:WO2020045898A1

    公开(公告)日:2020-03-05

    申请号:PCT/KR2019/010719

    申请日:2019-08-22

    Inventor: 박형민 조병준

    Abstract: 본 발명의 실시예에 따른 노이즈 제거 방법에서는 이전 프레임에 상응하는 제1 이전 파-엔드(Far-end) 채널필터, 제2 이전 파-엔드 채널필터 및 입력신호에 기초하여 산출되는 제1 추정 출력신호를 제공할 수 있다. 제1 추정 출력신호 및 제1 이전 파-엔드 채널필터에 따라 현재 프레임에 상응하는 제1 현재 파-엔드 채널필터를 업데이트할 수 있다. 제1 현재 파-엔드 채널필터, 제2 이전 파-엔드 채널필터 및 입력신호에 기초하여 산출되는 제2 추정 출력신호를 제공할 수 있다. 제2 추정 출력신호 및 제2 이전 파-엔드 채널필터에 따라 현재 프레임에 상응하는 제2 현재 파-엔드 채널필터를 업데이트할 수 있다. 제1 현재 파-엔드 채널필터, 제2 현재 파-엔드 채널필터 및 입력신호에 기초하여 산출되는 결과신호를 제공할 수 있다. 본 발명에 따른 노이즈 제거 방법을 사용하면 입력신호로부터 스테레오 에코 신호를 제거함으로써 노이즈가 제거된 음성신호를 제공할 수 있다.

    스테레오 노이즈 제거 장치 및 스테레오 노이즈 제거 방법

    公开(公告)号:KR102204119B1

    公开(公告)日:2021-01-18

    申请号:KR1020190101737

    申请日:2019-08-20

    Inventor: 박형민 조병준

    Abstract: 본발명의실시예에따른노이즈제거방법에서는이전프레임에상응하는제1 이전파-엔드(Far-end) 채널필터, 제2 이전파-엔드채널필터및 입력신호에기초하여산출되는제1 추정출력신호를제공할수 있다. 제1 추정출력신호및 제1 이전파-엔드채널필터에따라현재프레임에상응하는제1 현재파-엔드채널필터를업데이트할수 있다. 제1 현재파-엔드채널필터, 제2 이전파-엔드채널필터및 입력신호에기초하여산출되는제2 추정출력신호를제공할수 있다. 제2 추정출력신호및 제2 이전파-엔드채널필터에따라현재프레임에상응하는제2 현재파-엔드채널필터를업데이트할수 있다. 제1 현재파-엔드채널필터, 제2 현재파-엔드채널필터및 입력신호에기초하여산출되는결과신호를제공할수 있다. 본발명에따른노이즈제거방법을사용하면입력신호(IN_S)로부터스테레오에코신호를제거함으로써노이즈가제거된음성신호를제공할수 있다.

    음성인식 장치 및 음성인식 장치의 동작방법

    公开(公告)号:KR102208536B1

    公开(公告)日:2021-01-27

    申请号:KR1020190052951

    申请日:2019-05-07

    Abstract: 본발명의실시예에따른음성인식장치는음원위치정보제공부, 영상위치정보제공부, 빔포밍위치정보제공부및 빔포밍부를포함할수 있다. 음원위치정보제공부는소리입력신호에기초하여소리입력신호에포함되는타겟음원의위치정보및 외부잡음원의위치정보를제공할수 있다. 영상위치정보제공부는영상입력신호에기초하여영상입력신호에포함되는관심음원의위치정보를제공하고, 관심음원중 사람의얼굴로판단되는얼굴영역영상을제공할수 있다. 빔포밍위치정보제공부는타겟음원의위치정보, 외부잡음원의위치정보, 관심음원의위치정보및 얼굴영역영상으로부터추출되는발화자의입술움직임정보에기초하여발화자의위치정보및 나머지음원의위치정보를제공할수 있다. 빔포밍부는발화자의위치정보및 나머지음원의위치정보에기초하여빔포밍된빔포밍소리신호를제공할수 있다. 본발명에따른음성인식장치에서는소리입력신호및 영상입력신호에기초하여생성되는발화자의위치정보및 나머지음원의위치정보에따라빔포밍하여빔포밍소리신호를제공함으로써음성인식의성능을향상시킬수 있다.

    음성인식 장치 및 음성인식 장치의 동작방법

    公开(公告)号:KR1020200129219A

    公开(公告)日:2020-11-18

    申请号:KR1020190052951

    申请日:2019-05-07

    Abstract: 본발명의실시예에따른음성인식장치는음원위치정보제공부, 영상위치정보제공부, 빔포밍위치정보제공부및 빔포밍부를포함할수 있다. 음원위치정보제공부는소리입력신호에기초하여소리입력신호에포함되는타겟음원의위치정보및 외부잡음원의위치정보를제공할수 있다. 영상위치정보제공부는영상입력신호에기초하여영상입력신호에포함되는관심음원의위치정보를제공하고, 관심음원중 사람의얼굴로판단되는얼굴영역영상을제공할수 있다. 빔포밍위치정보제공부는타겟음원의위치정보, 외부잡음원의위치정보, 관심음원의위치정보및 얼굴영역영상으로부터추출되는발화자의입술움직임정보에기초하여발화자의위치정보및 나머지음원의위치정보를제공할수 있다. 빔포밍부는발화자의위치정보및 나머지음원의위치정보에기초하여빔포밍된빔포밍소리신호를제공할수 있다. 본발명에따른음성인식장치에서는소리입력신호및 영상입력신호에기초하여생성되는발화자의위치정보및 나머지음원의위치정보에따라빔포밍하여빔포밍소리신호를제공함으로써음성인식의성능을향상시킬수 있다.

Patent Agency Ranking