-
公开(公告)号:KR101550501B1
公开(公告)日:2015-09-04
申请号:KR1020130136846
申请日:2013-11-12
Applicant: 고려대학교 산학협력단
IPC: G10L21/02
Abstract: 잔여에코제거방법및 그장치가개시된다. 잔여에코제거방법은 (a) 입력신호의상태를검출하는단계; (b) 상기검출된상태에따라필터가중치갱신여부를결정하여상기입력신호에대한 1차에코를제거하는단계; (c) 스피커를통해출력되는후단신호(far-end signal)를분류하는단계; 및 (d) 상기분류결과에따라상기 1차에코제거된신호에서파워스펙트럼밀도추정에따른하모닉성분을이용한잔여에코성분추정여부를결정하여잔여에코를제거하는단계를포함한다.
-
公开(公告)号:KR101812159B1
公开(公告)日:2017-12-26
申请号:KR1020160132070
申请日:2016-10-12
Applicant: 고려대학교 산학협력단
Abstract: 모델생성부가, 미리저장된복수의상호상관그래프를딥러닝(Deep Learning)에기초해학습하여상호상관그래프의핵심성분을강조한그래프인강조상호상관그래프를생성하는모델인그래프재생성모델을생성하는단계, 그래프생성부가, 특정음원으로부터생성되어복수개의마이크가각각수집한복수개의수집음향데이터상호간의주파수영역에서의상호상관그래프인수집데이터상호상관그래프를생성하는단계, 그래프재생성부가, 수집데이터상호상관그래프를그래프재생성모델에입력하여수집데이터상호상관그래프의핵심성분을강조한그래프인수집데이터강조상호상관그래프를생성하는단계및 음향방향추정부가, 수집데이터강조상호상관그래프에기초하여, 특정음원이존재하는방향을추정하는단계를포함하는것을특징으로하는, 딥러닝을이용한음향방향추정방법및 이를위한장치에관한것이다.
Abstract translation: 模型生成单元,生成模型,用于生成多个互相关的曲线图中再生模型通过学习(深度学习)的基础上,图形深度学习曲线重点突出显示预先存储的互相关图表的互相关图表的一个关键组成部分, 多个产生收集的数据的互相关图表eseoui频域的多个收集,分别收集的声音数据,图表再生加入之间的互相关的曲线图麦克风,收集的数据的互相关图表:图形产生部分,从一个特定的声源,其包括产生 输入到图表再生模型的估计步骤强调所收集的数据传送到互相关图表的核心部件产生收集的数据的曲线图强调的互相关图表和声音方向此外,基于所收集的数据以强调互相关图表,特定的声源的方向上存在 并使用深度学习方法估计声学方向。 本发明涉及用于设备。
-
公开(公告)号:KR1020130127597A
公开(公告)日:2013-11-25
申请号:KR1020120051243
申请日:2012-05-15
Applicant: 고려대학교 산학협력단
CPC classification number: G10L21/0232 , G10L25/87 , H04R3/04
Abstract: A noise-canceling device and a method thereof are disclosed. The disclosed noise-canceling device is a device which removes noises in the signals inputted to multiple voice input devices and comprises a phase difference calculation part calculating a phase difference between a first signal and a second signal inputted to a first voice input device and a second voice input device, respectively; a size difference calculation part extracting noise components from the first signal and the second signal and calculating a size difference between the extracted noise component and the first signal; and a noise-canceling coefficient calculation part calculating a noise-canceling coefficient using the phase difference and the size difference. In accordance with the present invention, an error rate can be reduced by removing the signals having undesired directivity as noise from the signals inputted to the voice input devices, and the divergence or convergence rate of output does not fail due to the convergence of the problems of an adaptive filter by not using the adaptive filter. [Reference numerals] (100) Noise removing device;(AA) Determine voice components;(BB) Apply a fuzzy rule;(CC) Calculate a noise-canceling coefficient;(DD) Reflect a noise-canceling coefficient and perform inverse transformation;(EE) Final output;(FF) Calculate the size difference;(GG) Calculate the phase difference
Abstract translation: 公开了一种噪声消除装置及其方法。 所公开的噪声消除装置是去除输入到多个语音输入装置的信号中的噪声的装置,包括计算第一信号和输入到第一语音输入装置的第二信号之间的相位差的相位差计算部, 语音输入设备; 尺寸差分计算部分从第一信号和第二信号中提取噪声分量,并计算提取的噪声分量与第一信号之间的尺寸差; 以及噪声消除系数计算部分,使用相位差和尺寸差来计算噪声消除系数。 根据本发明,可以通过从输入到语音输入装置的信号中去除具有不期望的方向性的信号作为噪声,并且由于问题的收敛而导致的输出的发散或收敛速度不会失败,可以降低错误率 的自适应滤波器。 (100)噪声去除装置(AA)确定声音成分;(BB)应用模糊规则;(CC)计算消噪系数;(DD)反映噪声消除系数并进行逆变换; (EE)最终输出;(FF)计算尺寸差;(GG)计算相位差
-
公开(公告)号:KR101842612B1
公开(公告)日:2018-03-27
申请号:KR1020160132071
申请日:2016-10-12
Applicant: 고려대학교 산학협력단
Abstract: 모델생성부가, 미리저장된복수의관심음향데이터및 복수의비관심음향데이터를딥러닝(Deep Learning)에기초해학습하여관심음향인식모델을생성하는단계, 유사도점수산출부가, 외부로부터수집된음향데이터인수집음향데이터를관심음향인식모델에입력하여수집음향데이터에대한관심음향유사도점수및 비관심음향유사도점수를각각산출하는단계및 관심음향판단부가, 관심음향유사도점수및 비관심음향유사도점수를비교하여, 수집음향데이터가관심음향인지여부를판단하는단계를포함하는것을특징으로하는, 딥러닝을이용한관심음향인식방법및 장치에관한것이다.
Abstract translation: 模型生成单元,其包括学习多个兴趣的声音数据和多个先前存储在深度学习(深度学习)生成感兴趣声音识别模型非兴趣的声音数据的基础上的步骤,相似性得分计算部的程度,从外部收集的声音数据 用于家庭的声音数据计算的感兴趣的声识别感兴趣的声相似性,以收集声分别输入到模型得分和非兴趣的声音的相似性得分,数据和感兴趣的声音判断部的点获取步骤比较感兴趣的声相似性得分和非兴趣的声音的相似性得分 并且确定收集的声学数据是否是感兴趣的。本发明涉及使用深度学习方法识别声音的方法和设备。
-
公开(公告)号:KR1020160050277A
公开(公告)日:2016-05-11
申请号:KR1020140148100
申请日:2014-10-29
Applicant: 고려대학교 산학협력단
CPC classification number: H04N5/262 , H04N5/2621 , H04N9/07
Abstract: 주행정보처리장치가개시된다. 본발명의일 실시예에따른주행정보처리장치는주행중 또는주행중이아닌경우의영상정보및 소리정보중 적어도하나를수신하며, 복수개의마이크로폰, 적외선센서및 CCD 영상센서로구성되는수신부, 상기수신된영상정보또는소리정보를다양한정보로분리, 조합및 처리하는전처리가이루어지는전처리부및 선택입력에따라상기전처리된영상정보및 소리정보중 적어도하나에대하여디스플레이, 전송, 저장및 미리설정된처리중 적어도하나의동작을수행하는정보처리부를포함할수 있다.
Abstract translation: 公开了一种驾驶信息处理装置。 根据本发明的实施例,驱动信息处理装置包括:接收单元,被配置为在驱动或不驱动期间接收图像信息和声音信息中的至少一个,并且具有多个麦克风,红外线传感器和CCD图像 传感器; 执行将接收的图像信息或声音信息分割,组合和处理为各种信息的预处理的预处理单元; 以及信息处理单元,被配置为根据选择输入对所述预处理图像信息或声音信息进行显示,发送,存储或预设处理中的至少一个操作。
-
公开(公告)号:KR101424327B1
公开(公告)日:2014-07-31
申请号:KR1020120051243
申请日:2012-05-15
Applicant: 고려대학교 산학협력단
Abstract: 잡음 제거 장치 및 방법이 개시된다. 개시된 잡음 제거 장치는 복수의 음성입력장치로 입력된 신호에서 잡음을 제거하는 장치로서, 제1 음성입력장치 및 제2 음성입력장치에서 각각 입력된 제1 신호 및 제2 신호간의 위상 차를 계산하는 위상 차 계산부; 상기 제1 신호 및 제2 신호에서 잡음 성분을 추출하고, 상기 추출된 잡음 성분과 상기 제1 신호와의 크기(magnitude) 차를 산출하는 크기 차 산출부; 및 상기 위상 차 및 크기 차를 이용하여 잡음제거 계수를 산출하는 잡음제거 계수 산출부를 포함한다. 본 발명에 따르면, 복수의 음성입력장치로 입력된 신호에서 원하지 않는 방향성을 갖는 신호를 잡음으로 제거함에 있어서 오류의 발생률을 줄일 수 있는 장점이 있다. 또한, 본 발명에 따르면, 적응 필터를 사용하지 않아 적응 필터 수렴 문제로 인한 출력의 발산이나 수렴 속도의 저하 문제가 발생되지 않는 장점을 갖는다.
-
公开(公告)号:KR1020130005805A
公开(公告)日:2013-01-16
申请号:KR1020110067427
申请日:2011-07-07
Applicant: 고려대학교 산학협력단
CPC classification number: H04R3/02 , G10L2021/02082 , H04B3/23 , H04M9/08
Abstract: PURPOSE: A voice residual echo suppression apparatus and a method are provided to enhance recognition performance of voice recognizer by elevating voice clearness of speaker through revision using harmonic component in the mobile communication. CONSTITUTION: An estimating unit(220) estimates a power spectrum density of noise, residual echo, and voice signal from the input signal. A residual echo correction unit(230) corrects a power spectrum density of the residual echo using harmonic component of residual echo estimated from power spectrum density of the residual echo. A voice signal correction unit(240) corrects a power spectrum density of the audio signal using harmonic component of voice signal estimated from the power spectrum density of the voice signal. A removing unit(250) removes residual echo using the power spectrum density of the noise, the power spectrum density of corrected residual echo, and the power spectrum density of corrected voice signal. [Reference numerals] (220) Estimating unit; (230) Residual echo correction unit; (240) Voice signal correction unit; (250) Removing unit; (260) Input unit; (260) Output unit
Abstract translation: 目的:提供语音残余回声抑制装置和方法,以通过在移动通信中使用谐波分量通过修正提升扬声器的语音清晰度来增强语音识别器的识别性能。 构成:估计单元(220)从输入信号估计噪声的功率谱密度,残余回声和语音信号。 残余回波校正单元(230)使用从残余回波的功率谱密度估计出的残余回波的谐波分量来校正残余回波的功率谱密度。 语音信号校正单元(240)使用从语音信号的功率谱密度估计的语音信号的谐波分量来校正音频信号的功率谱密度。 去除单元(250)使用噪声的功率谱密度,校正残差回波的功率谱密度和校正的语音信号的功率谱密度来去除残留回波。 (附图标记)(220)估计单元; (230)残余回波校正单元; (240)语音信号校正单元; (250)拆卸单元; (260)输入单元; (260)输出单元
-
公开(公告)号:KR101655867B1
公开(公告)日:2016-09-08
申请号:KR1020140148100
申请日:2014-10-29
Applicant: 고려대학교 산학협력단
Abstract: 주행정보처리장치가개시된다. 본발명의일 실시예에따른주행정보처리장치는주행중 또는주행중이아닌경우의영상정보및 소리정보중 적어도하나를수신하며, 복수개의마이크로폰, 적외선센서및 CCD 영상센서로구성되는수신부, 상기수신된영상정보또는소리정보를다양한정보로분리, 조합및 처리하는전처리가이루어지는전처리부및 선택입력에따라상기전처리된영상정보및 소리정보중 적어도하나에대하여디스플레이, 전송, 저장및 미리설정된처리중 적어도하나의동작을수행하는정보처리부를포함할수 있다.
-
公开(公告)号:KR1020150054424A
公开(公告)日:2015-05-20
申请号:KR1020130136846
申请日:2013-11-12
Applicant: 고려대학교 산학협력단
IPC: G10L21/02
CPC classification number: G10L21/02 , G10L21/0208
Abstract: 잔여에코제거방법및 그장치가개시된다. 잔여에코제거방법은 (a) 입력신호의상태를검출하는단계; (b) 상기검출된상태에따라필터가중치갱신여부를결정하여상기입력신호에대한 1차에코를제거하는단계; (c) 스피커를통해출력되는후단신호(far-end signal)를분류하는단계; 및 (d) 상기분류결과에따라상기 1차에코제거된신호에서파워스펙트럼밀도추정에따른하모닉성분을이용한잔여에코성분추정여부를결정하여잔여에코를제거하는단계를포함한다.
Abstract translation: 提供了一种残余回波消除方法及其装置。 剩余回声消除方法包括以下步骤:(a)检测输入信号的状态; (b)通过参考检测到的状态来决定滤波器加权的更新来取消输入信号的第一回波; (c)对通过扬声器输出的远端信号进行分类; 以及(d)基于根据分类结果取消回波的第一信号的功率谱的密度估计,通过使用谐波分量来决定残留回波的分量估计来消除残差回波。
-
公开(公告)号:KR101357381B1
公开(公告)日:2014-02-05
申请号:KR1020120050478
申请日:2012-05-11
Applicant: 고려대학교 산학협력단
IPC: G10L21/02
Abstract: 음성 인식을 위한 음성 인식 대상 구간을 검출하는 신호 처리 장치 및 방법이 제공된다. 상기 신호 처리 장치는, 입력 신호로부터 노이즈를 제거하여 제1 음성 인식 대상 구간을 추출하는 음성 추출부, 상기 입력 신호로부터 상기 신호 처리 장치에 연관된 반향이 포함된 구간을 제거하여 제2 음성 인식 대상 구간을 추출하는 반향 제거부, 및 상기 제1 음성 인식 대상 구간과 상기 제2 음성 인식 대상 구간의 중첩 구간을 상기 음성 인식을 위한 음성 인식 대상 구간으로 결정하는 연산부를 포함한다.
-
-
-
-
-
-
-
-
-