-
公开(公告)号:WO2021075709A1
公开(公告)日:2021-04-22
申请号:PCT/KR2020/011673
申请日:2020-09-01
Applicant: 고려대학교 산학협력단
Abstract: 잡음 환경에 강인한 동물 종 식별 장치 및 방법은 동물 종들의 울음소리에 기초하여 동물 울음소리 구간을 검출하고, 동물 울음소리가 존재하지 않는 구간을 바탕으로 잡음을 추정하여 수신된 소리에서 잡음을 제거한 후, 다양한 잡음에도 강화된 음향 특징을 학습하여 동물 종을 식별할 수 있다. [대표도] 도 1
-
公开(公告)号:WO2020080626A1
公开(公告)日:2020-04-23
申请号:PCT/KR2019/004677
申请日:2019-04-18
Applicant: 고려대학교 산학협력단
Abstract: 본 발명은 시청각 정보를 이용하여 동물 종을 식별하는 방법 및 장치에 관한 것이다. 본 발명의 일실시예에 의한 동물 종 식별방법은 대상 객체에 대한 입력 신호를 수신하는 단계; 상기 입력 신호에 근거하여 영상정보 및 음향정보 처리하는 단계 상기 영상정보 처리 결과 및 상기 음향정보 처리 결과는 클래스 별 스코어로 표현됨-; 상기 입력 신호에 대응되는 영상정보 처리 결과 및 음향정보 처리 결과가 존재하는지를 판단하는 단계; 및 상기 판단 결과에 따라 상기 영상정보 처리 결과 및 음향정보 처리 결과를 융합하고, 상기 융합된 처리 결과를 이용하여 상기 대상 객체가 어떤 동물 종 인지를 분류하는 최종 결과 도출 단계를 포함할 수 있다.
-
公开(公告)号:WO2016148322A1
公开(公告)日:2016-09-22
申请号:PCT/KR2015/002654
申请日:2015-03-19
Applicant: 삼성전자 주식회사 , 고려대학교 산학협력단
IPC: G06T7/20
CPC classification number: G06T7/20
Abstract: 적어도 하나의 영상에서 입술이 존재하는 영역을 검출하고, 상기 검출된 영역에 포함된 픽셀값들의 차이에 기초하여, 상기 검출된 영역의 입술 움직임에 대한 특징값을 획득하여, 상기 특징값에 기초하여, 상기 적어도 하나의 영상으로부터 상기 음성 구간을 검출하는, 방법이 개시된다.
Abstract translation: 公开了一种方法:检测至少一个图像中存在唇部的区域; 基于检测区域中包括的像素的值的差异,获取检测区域中唇部移动的特征值; 并且基于特征值从至少一个图像检测语音活动。
-
公开(公告)号:WO2016137042A1
公开(公告)日:2016-09-01
申请号:PCT/KR2015/001953
申请日:2015-02-27
Applicant: 삼성전자 주식회사 , 고려대학교 산학협력단
IPC: G10L17/02
Abstract: 사용자의 발성을 포함하는 음성 신호로부터 특징 시퀀스를 추출하고, 상기 추출된 특징 시퀀스로부터 특징 벡터를 추출하고, 서로 다른 공분산 값에 기초한 확률값에 기초하여, 상기 검출된 특징 벡터의 차원 수를 줄이기 위한 변환 행렬을 획득하고, 상기 변환 행렬을 이용하여 상기 특징 벡터를 변환하는, 특징 벡터를 변환하는 방법이 개시된다.
Abstract translation: 公开了一种用于变换特征向量的方法,包括:从包括用户发声的音频信号中提取特征序列; 从所提取的特征序列中提取特征向量; 基于不同协方差值的概率值获得用于减少所提取的特征向量的维数的变换矩阵; 并使用变换矩阵来变换特征向量。
-
公开(公告)号:WO2014193080A1
公开(公告)日:2014-12-04
申请号:PCT/KR2014/003144
申请日:2014-04-11
Applicant: 삼성테크윈 주식회사 , 고려대학교 산학협력단
CPC classification number: G06T5/001 , G06T5/003 , G06T2207/10016 , G06T2207/20192 , H04N5/361 , H04N5/3651
Abstract: 본 발명에서는 단일영상 내의 안개 제거 방법을 개시한다. 본 발명에서는 안개 입력 영상에서 구해진 다크 채널 프라이어를 이용하여 전달량을 추정한다. 이렇게 구해진 추정 전달량에는 블락 아티팩트가 포함되어 있다. 본 발명의 바람직한 일 실시예에서는, 에지를 보존하면서 블락 아티팩트를 제거하기 위해 추정 전달량 값과 모폴로지 처리된 입력 영상을 이용하여 WLS 필터링을 수행하여 정련전달량 값을 구하고, 이를 기초로 영상을 복원한 후 멀티 스케일 톤 메니퓰레이션 이미지 처리를 수행한다.
Abstract translation: 公开了一种除去单一图像中的雾度的方法。 在本发明中,使用从混浊输入图像获得的暗信道估计传输。 估计的传输包括块伪影。 在本发明的实施例中,为了保留边缘并去除块伪像,通过使用估计的传输值和形态处理的输入图像的WLS滤波获得精细的传输值,基于精细传输恢复图像 ,然后执行多尺度音调处理图像处理。
-
公开(公告)号:KR101932535B1
公开(公告)日:2018-12-27
申请号:KR1020120093894
申请日:2012-08-27
Applicant: 한화테크윈 주식회사 , 고려대학교 산학협력단
Abstract: 본 발명은 실내 감시 시스템 및 실내 감시 방법을 개시한다.
본 발명의 실내 감시 시스템은, 음향 신호로부터 음향 특징을 추출하고, 상기 추출된 음향 특징을 기초로 감시 영역에서 비정상 이벤트 발생 여부를 판단하는 음향 처리 장치; 영상 신호로부터 전경 블랍을 검출하고, 상기 검출된 전경 블랍의 모션 정보를 기초로 상기 감시 영역에서 비정상 이벤트 발생 여부를 판단하는 영상 처리 장치; 및 상기 음향 신호에 대한 비정상 이벤트 판단 결과 및 상기 영상 신호에 대한 비정상 이벤트 판단 결과를 일정 시간 누적하여 음향 비정상 확률 및 영상 비정상 확률을 산출하고, 정상 상황 및 비정상 상황에 대한 결합 비정상 확률 분포 모델을 이용하여 상기 감시 영역에서 비정상 상황 발생 여부를 최종 판단하는 상황 인지 장치;를 포함할 수 있다.-
公开(公告)号:KR101858646B1
公开(公告)日:2018-05-17
申请号:KR1020120146621
申请日:2012-12-14
Applicant: 한화에어로스페이스 주식회사 , 고려대학교 산학협력단
CPC classification number: H04N5/33 , H04N5/2258 , H04N5/2351 , H04N5/243 , H04N5/265 , H04N5/332
Abstract: 본발명은영상융합장치및 방법에관한것으로, 보다상세하게는가시(visible) 카메라로촬영된가시영상의단점및 적외선(infrared, IR) 카메라로촬영된적외선영상의단점을해결하여가시영상및 적외선영상을융합하는영상융합장치및 방법에관한것이다. 영상융합방법은동일한피사체에대한가시카메라에의해생성된가시영상으로서의제1 영상및 적외선카메라에의해생성된적외선영상으로서의제2 영상을정합하는단계, 정합된제1 영상의밝기를기준으로정합된제2 영상의밝기를변환시키는단계및 정합된제1 영상및 밝기가변환된제2 영상을융합하는단계를포함한다.
-
公开(公告)号:KR101812159B1
公开(公告)日:2017-12-26
申请号:KR1020160132070
申请日:2016-10-12
Applicant: 고려대학교 산학협력단
Abstract: 모델생성부가, 미리저장된복수의상호상관그래프를딥러닝(Deep Learning)에기초해학습하여상호상관그래프의핵심성분을강조한그래프인강조상호상관그래프를생성하는모델인그래프재생성모델을생성하는단계, 그래프생성부가, 특정음원으로부터생성되어복수개의마이크가각각수집한복수개의수집음향데이터상호간의주파수영역에서의상호상관그래프인수집데이터상호상관그래프를생성하는단계, 그래프재생성부가, 수집데이터상호상관그래프를그래프재생성모델에입력하여수집데이터상호상관그래프의핵심성분을강조한그래프인수집데이터강조상호상관그래프를생성하는단계및 음향방향추정부가, 수집데이터강조상호상관그래프에기초하여, 특정음원이존재하는방향을추정하는단계를포함하는것을특징으로하는, 딥러닝을이용한음향방향추정방법및 이를위한장치에관한것이다.
Abstract translation: 模型生成单元,生成模型,用于生成多个互相关的曲线图中再生模型通过学习(深度学习)的基础上,图形深度学习曲线重点突出显示预先存储的互相关图表的互相关图表的一个关键组成部分, 多个产生收集的数据的互相关图表eseoui频域的多个收集,分别收集的声音数据,图表再生加入之间的互相关的曲线图麦克风,收集的数据的互相关图表:图形产生部分,从一个特定的声源,其包括产生 输入到图表再生模型的估计步骤强调所收集的数据传送到互相关图表的核心部件产生收集的数据的曲线图强调的互相关图表和声音方向此外,基于所收集的数据以强调互相关图表,特定的声源的方向上存在 并使用深度学习方法估计声学方向。 本发明涉及用于设备。
-
公开(公告)号:KR101767928B1
公开(公告)日:2017-08-31
申请号:KR1020120081973
申请日:2012-07-26
Applicant: 한화테크윈 주식회사 , 고려대학교 산학협력단
Abstract: 본발명은음원위치추정장치및 방법에관한것으로, 보다상세하게는마이크구조를이용하여음원방향을분할하고, 분할된음원방향영역을검출할수 있는마이크쌍들의조합을통해 SRP-PHAT를계산하여정확하게음원의위치를추정하는음원위치추정장치및 방법에관한것이다. 음원위치추정방법은복수의마이크로부터소리를획득하는단계, 서로다른두 개의마이크조합으로부터획득된소리에대해상호상관관계(GCC)를산출하는단계, 마이크구조를이용하여음원방향을제1 내지제4 영역으로분할하고, 제1 내지제4 영역에대응하는상호상관관계를조합하여 SRP-PHAT를산출하는단계및 소정의시간대별로산출된 SRP-PHAT를누적하여최대 SRP-PHAT가가장많이누적된방향을음원위치로추정하는단계를포함한다.
Abstract translation: 确切地,本发明涉及一种声源位置估计装置和方法,更具体地说,涉及通过麦克风对的组合来计算SRP-PHAT在这里可以使用麦克风结构,以及检测所述划分声源方向区域分割的声源方向 更具体地,涉及用于估计声源的位置的声源位置估计设备和方法。 一种用于估计声源位置的方法包括以下步骤:从多个麦克风获取声音,计算从两个不同麦克风组合获得的声音的互相关(GCC) 通过组合对应于第一至第四区域的互相关来计算SRP-PHAT,累积针对每个预定时间段计算的SRP-PHAT,并且将最大SRP-PHAT 到声源位置。
-
公开(公告)号:KR101767925B1
公开(公告)日:2017-08-18
申请号:KR1020120081970
申请日:2012-07-26
Applicant: 한화테크윈 주식회사 , 고려대학교 산학협력단
Abstract: 본발명은음원위치추정장치및 방법에관한것으로, 보다상세하게는음원위치추정을위한 SRP-PHAT 연산량을줄여음원위치추정속도를향상시키는음원위치추정장치및 방법에관한것이다. 음원위치추정방법은복수의관심있는비정상사운드프레임을기반으로히스토그램을생성하여데이터베이스를구축하는단계, 멀티채널로부터입력되는사운드신호를고속푸리에변환하는단계, 데이터베이스에저장된히스토그램중 소정의조건을만족하는주파수인덱스를선택제어신호로하여, 고속푸리에변환된신호로부터소정개수의주파수인덱스를선택하는단계, 선택된주파수인덱스에해당하는신호에대해 SRP-PHAT를산출하는단계를포함한다. 본발명에따르면, 관심있는비정상사운드신호로부터생성된히스토그램을저장하고있는데이터베이스를기반으로음원위치추정을위한 SRP-PHAT 연산량을줄여음원위치추정속도를향상시킬수 있다.
-
-
-
-
-
-
-
-
-