-
公开(公告)号:KR101969504B1
公开(公告)日:2019-04-16
申请号:KR1020170056345
申请日:2017-05-02
Applicant: 서강대학교산학협력단 , 블루카이트주식회사
IPC: G10L25/30 , G10L21/0208 , G10L25/48
-
-
公开(公告)号:WO2020045898A1
公开(公告)日:2020-03-05
申请号:PCT/KR2019/010719
申请日:2019-08-22
Applicant: 서강대학교산학협력단
IPC: H04R3/02 , H04R3/04 , H04R5/04 , G10L21/0208
Abstract: 본 발명의 실시예에 따른 노이즈 제거 방법에서는 이전 프레임에 상응하는 제1 이전 파-엔드(Far-end) 채널필터, 제2 이전 파-엔드 채널필터 및 입력신호에 기초하여 산출되는 제1 추정 출력신호를 제공할 수 있다. 제1 추정 출력신호 및 제1 이전 파-엔드 채널필터에 따라 현재 프레임에 상응하는 제1 현재 파-엔드 채널필터를 업데이트할 수 있다. 제1 현재 파-엔드 채널필터, 제2 이전 파-엔드 채널필터 및 입력신호에 기초하여 산출되는 제2 추정 출력신호를 제공할 수 있다. 제2 추정 출력신호 및 제2 이전 파-엔드 채널필터에 따라 현재 프레임에 상응하는 제2 현재 파-엔드 채널필터를 업데이트할 수 있다. 제1 현재 파-엔드 채널필터, 제2 현재 파-엔드 채널필터 및 입력신호에 기초하여 산출되는 결과신호를 제공할 수 있다. 본 발명에 따른 노이즈 제거 방법을 사용하면 입력신호로부터 스테레오 에코 신호를 제거함으로써 노이즈가 제거된 음성신호를 제공할 수 있다.
-
公开(公告)号:WO2023038312A1
公开(公告)日:2023-03-16
申请号:PCT/KR2022/012169
申请日:2022-08-16
Applicant: (주)텐마인즈 , 서강대학교산학협력단
Abstract: 본 발명은 코골이 감지 및 개선 기능을 갖는 베개 시스템에 관한 것이다. 보다 구체적으로, 본 발명의 일 실시예에 따른 코골이 감지 및 개선 기능을 갖는 베개 시스템은, 내부 공기압이 조절되어 사용자의 머리를 이동 또는 회전시키는 베개(200); 및 상기 베개(200)와 연결되며, 미리 설정된 사용자의 위치 정보에 기초하여 사용자의 코골이 소리를 감지하고, 상기 감지된 코골이 소리에 따라 상기 베개(200)의 내부 공기압을 조절하는 구동신호를 발생시키는 솔루션 박스(100)를 포함할 수 있다.
-
公开(公告)号:WO2022163972A1
公开(公告)日:2022-08-04
申请号:PCT/KR2021/015513
申请日:2021-11-01
Applicant: 서강대학교산학협력단
Abstract: 본 발명의 실시예에 따른 동영상 기반 행동인식 장치의 동작방법에서는, 합성 채널 프레임 제공부가 복수의 채널들 중 각 채널에 상응하는 채널 프레임들을 비교하여 하이라이트 정보를 생성하고, 채널 프레임들과 하이라이트 정보를 합성하여 합성 채널 프레임을 제공할 수 있다. 뉴럴 네트워크부가 합성 채널 프레임 및 멀티프레임 컨볼루션 뉴럴네트워크에 기초하여 중간 프레임를 제공할 수 있다. 행동인식 결과 제공부가 중간 프레임에 따라 생성되는 가중치 값 및 중간 프레임에 기초하여 행동인식 결과를 제공할 수 있다. 본 발명에 따른 동영상 기반 행동인식 장치의 동작방법에서는, 채널별로 제공되는 채널 프레임들로부터 합성되는 합성 채널 프레임 및 멀티프레임 컨볼루션 뉴럴네트워크에 기초하여 행동인식 결과를 제공함으로써 동영상 내의 이벤트 발생을 보다 효과적으로 검출할 수 있다.
-
公开(公告)号:WO2013085278A1
公开(公告)日:2013-06-13
申请号:PCT/KR2012/010480
申请日:2012-12-05
Applicant: 경북대학교 산학협력단 , 서강대학교산학협력단
IPC: G01Q20/00
CPC classification number: G10L17/02 , G06K9/00221 , G06K9/4628 , G06K9/4671 , G10L15/25 , H04N7/18
Abstract: 모니터링 장치가 개시된다. 본 모니터링 장치는, 이격된 위치에서 촬영된 복수의 이미지 및 이격된 위치에서 청취된 복수의 음원을 입력받는 입력부, 복수의 이미지 각각에 대한 복수의 모노 돌출맵을 생성하고, 생성된 복수의 모노 돌출맵을 이용하여 동적 돌출맵을 생성하는 돌출맵 생성부, 복수의 음원을 분석하여 음원의 위치를 판단하는 위치 판단부, 생성된 동적 돌출맵 및 판단된 음원 위치를 기초로 복수의 이미지에 대한 경로를 생성하는 시선 경로 인식부 및 생성된 시선 경로를 출력하는 출력부를 포함한다.
Abstract translation: 本发明涉及监视装置。 本监视装置包括:用于接收在分离位置听到的多个声源的输入单元和在分开的位置捕获的多个图像; 显着图生成单元,分别通过使用所生成的单体显着图生成分别用于多个图像的多个单显显示图和动态显着图; 位置确定单元,用于分析所述多个声源以确定所述声源的位置; 基于生成的动态显着图和确定的声源位置,生成用于生成多个图像的路径的视线路径的识别单元; 以及用于输出生成的视线路径的输出单元。
-
公开(公告)号:KR102208536B1
公开(公告)日:2021-01-27
申请号:KR1020190052951
申请日:2019-05-07
Applicant: 서강대학교산학협력단
IPC: G10L15/25 , G10L25/93 , G10L21/0216
Abstract: 본발명의실시예에따른음성인식장치는음원위치정보제공부, 영상위치정보제공부, 빔포밍위치정보제공부및 빔포밍부를포함할수 있다. 음원위치정보제공부는소리입력신호에기초하여소리입력신호에포함되는타겟음원의위치정보및 외부잡음원의위치정보를제공할수 있다. 영상위치정보제공부는영상입력신호에기초하여영상입력신호에포함되는관심음원의위치정보를제공하고, 관심음원중 사람의얼굴로판단되는얼굴영역영상을제공할수 있다. 빔포밍위치정보제공부는타겟음원의위치정보, 외부잡음원의위치정보, 관심음원의위치정보및 얼굴영역영상으로부터추출되는발화자의입술움직임정보에기초하여발화자의위치정보및 나머지음원의위치정보를제공할수 있다. 빔포밍부는발화자의위치정보및 나머지음원의위치정보에기초하여빔포밍된빔포밍소리신호를제공할수 있다. 본발명에따른음성인식장치에서는소리입력신호및 영상입력신호에기초하여생성되는발화자의위치정보및 나머지음원의위치정보에따라빔포밍하여빔포밍소리신호를제공함으로써음성인식의성능을향상시킬수 있다.
-
公开(公告)号:KR1020200129219A
公开(公告)日:2020-11-18
申请号:KR1020190052951
申请日:2019-05-07
Applicant: 서강대학교산학협력단
IPC: G10L15/25 , G10L25/93 , G10L21/0216
Abstract: 본발명의실시예에따른음성인식장치는음원위치정보제공부, 영상위치정보제공부, 빔포밍위치정보제공부및 빔포밍부를포함할수 있다. 음원위치정보제공부는소리입력신호에기초하여소리입력신호에포함되는타겟음원의위치정보및 외부잡음원의위치정보를제공할수 있다. 영상위치정보제공부는영상입력신호에기초하여영상입력신호에포함되는관심음원의위치정보를제공하고, 관심음원중 사람의얼굴로판단되는얼굴영역영상을제공할수 있다. 빔포밍위치정보제공부는타겟음원의위치정보, 외부잡음원의위치정보, 관심음원의위치정보및 얼굴영역영상으로부터추출되는발화자의입술움직임정보에기초하여발화자의위치정보및 나머지음원의위치정보를제공할수 있다. 빔포밍부는발화자의위치정보및 나머지음원의위치정보에기초하여빔포밍된빔포밍소리신호를제공할수 있다. 본발명에따른음성인식장치에서는소리입력신호및 영상입력신호에기초하여생성되는발화자의위치정보및 나머지음원의위치정보에따라빔포밍하여빔포밍소리신호를제공함으로써음성인식의성능을향상시킬수 있다.
-
公开(公告)号:KR102088355B1
公开(公告)日:2020-03-12
申请号:KR1020180100323
申请日:2018-08-27
Applicant: 서강대학교산학협력단
IPC: H04R3/02
-
公开(公告)号:KR101966175B1
公开(公告)日:2019-04-05
申请号:KR1020120050356
申请日:2012-05-11
Applicant: 엘지전자 주식회사 , 서강대학교산학협력단
IPC: G10L21/0208 , G10L19/02
-
-
-
-
-
-
-
-
-