-
公开(公告)号:WO2020045898A1
公开(公告)日:2020-03-05
申请号:PCT/KR2019/010719
申请日:2019-08-22
Applicant: 서강대학교산학협력단
IPC: H04R3/02 , H04R3/04 , H04R5/04 , G10L21/0208
Abstract: 본 발명의 실시예에 따른 노이즈 제거 방법에서는 이전 프레임에 상응하는 제1 이전 파-엔드(Far-end) 채널필터, 제2 이전 파-엔드 채널필터 및 입력신호에 기초하여 산출되는 제1 추정 출력신호를 제공할 수 있다. 제1 추정 출력신호 및 제1 이전 파-엔드 채널필터에 따라 현재 프레임에 상응하는 제1 현재 파-엔드 채널필터를 업데이트할 수 있다. 제1 현재 파-엔드 채널필터, 제2 이전 파-엔드 채널필터 및 입력신호에 기초하여 산출되는 제2 추정 출력신호를 제공할 수 있다. 제2 추정 출력신호 및 제2 이전 파-엔드 채널필터에 따라 현재 프레임에 상응하는 제2 현재 파-엔드 채널필터를 업데이트할 수 있다. 제1 현재 파-엔드 채널필터, 제2 현재 파-엔드 채널필터 및 입력신호에 기초하여 산출되는 결과신호를 제공할 수 있다. 본 발명에 따른 노이즈 제거 방법을 사용하면 입력신호로부터 스테레오 에코 신호를 제거함으로써 노이즈가 제거된 음성신호를 제공할 수 있다.
-
公开(公告)号:KR102204119B1
公开(公告)日:2021-01-18
申请号:KR1020190101737
申请日:2019-08-20
Applicant: 서강대학교산학협력단
IPC: H04R3/02 , H04R3/04 , H04R5/04 , G10L21/0208
Abstract: 본발명의실시예에따른노이즈제거방법에서는이전프레임에상응하는제1 이전파-엔드(Far-end) 채널필터, 제2 이전파-엔드채널필터및 입력신호에기초하여산출되는제1 추정출력신호를제공할수 있다. 제1 추정출력신호및 제1 이전파-엔드채널필터에따라현재프레임에상응하는제1 현재파-엔드채널필터를업데이트할수 있다. 제1 현재파-엔드채널필터, 제2 이전파-엔드채널필터및 입력신호에기초하여산출되는제2 추정출력신호를제공할수 있다. 제2 추정출력신호및 제2 이전파-엔드채널필터에따라현재프레임에상응하는제2 현재파-엔드채널필터를업데이트할수 있다. 제1 현재파-엔드채널필터, 제2 현재파-엔드채널필터및 입력신호에기초하여산출되는결과신호를제공할수 있다. 본발명에따른노이즈제거방법을사용하면입력신호(IN_S)로부터스테레오에코신호를제거함으로써노이즈가제거된음성신호를제공할수 있다.
-
公开(公告)号:KR1020160149736A
公开(公告)日:2016-12-28
申请号:KR1020150087304
申请日:2015-06-19
Applicant: 엘지전자 주식회사 , 서강대학교산학협력단
IPC: G10L21/0208 , G10L15/28
Abstract: 음성을인식하는음성인식장치가개시된다. 음성인식장치는음성신호를수신하는음성신호수신부; 및상기음성신호를주파수영역의주파수스펙트럼으로변환하고, 하모닉파워비율에기초하여상기주파수스펙트럼의정상성분을억제하는제어부를포함하고, 상기하모닉파워비율은전체주파수대역의파워대비하모닉성분들의파워비율이다.
-
-
公开(公告)号:KR102208536B1
公开(公告)日:2021-01-27
申请号:KR1020190052951
申请日:2019-05-07
Applicant: 서강대학교산학협력단
IPC: G10L15/25 , G10L25/93 , G10L21/0216
Abstract: 본발명의실시예에따른음성인식장치는음원위치정보제공부, 영상위치정보제공부, 빔포밍위치정보제공부및 빔포밍부를포함할수 있다. 음원위치정보제공부는소리입력신호에기초하여소리입력신호에포함되는타겟음원의위치정보및 외부잡음원의위치정보를제공할수 있다. 영상위치정보제공부는영상입력신호에기초하여영상입력신호에포함되는관심음원의위치정보를제공하고, 관심음원중 사람의얼굴로판단되는얼굴영역영상을제공할수 있다. 빔포밍위치정보제공부는타겟음원의위치정보, 외부잡음원의위치정보, 관심음원의위치정보및 얼굴영역영상으로부터추출되는발화자의입술움직임정보에기초하여발화자의위치정보및 나머지음원의위치정보를제공할수 있다. 빔포밍부는발화자의위치정보및 나머지음원의위치정보에기초하여빔포밍된빔포밍소리신호를제공할수 있다. 본발명에따른음성인식장치에서는소리입력신호및 영상입력신호에기초하여생성되는발화자의위치정보및 나머지음원의위치정보에따라빔포밍하여빔포밍소리신호를제공함으로써음성인식의성능을향상시킬수 있다.
-
公开(公告)号:KR1020200129219A
公开(公告)日:2020-11-18
申请号:KR1020190052951
申请日:2019-05-07
Applicant: 서강대학교산학협력단
IPC: G10L15/25 , G10L25/93 , G10L21/0216
Abstract: 본발명의실시예에따른음성인식장치는음원위치정보제공부, 영상위치정보제공부, 빔포밍위치정보제공부및 빔포밍부를포함할수 있다. 음원위치정보제공부는소리입력신호에기초하여소리입력신호에포함되는타겟음원의위치정보및 외부잡음원의위치정보를제공할수 있다. 영상위치정보제공부는영상입력신호에기초하여영상입력신호에포함되는관심음원의위치정보를제공하고, 관심음원중 사람의얼굴로판단되는얼굴영역영상을제공할수 있다. 빔포밍위치정보제공부는타겟음원의위치정보, 외부잡음원의위치정보, 관심음원의위치정보및 얼굴영역영상으로부터추출되는발화자의입술움직임정보에기초하여발화자의위치정보및 나머지음원의위치정보를제공할수 있다. 빔포밍부는발화자의위치정보및 나머지음원의위치정보에기초하여빔포밍된빔포밍소리신호를제공할수 있다. 본발명에따른음성인식장치에서는소리입력신호및 영상입력신호에기초하여생성되는발화자의위치정보및 나머지음원의위치정보에따라빔포밍하여빔포밍소리신호를제공함으로써음성인식의성능을향상시킬수 있다.
-
公开(公告)号:KR102088355B1
公开(公告)日:2020-03-12
申请号:KR1020180100323
申请日:2018-08-27
Applicant: 서강대학교산학협력단
IPC: H04R3/02
-
-
-
-
-
-