Patent search ap:("서울대학교산학협력단") AND inv:"김남수" Page 4

31.

发明公开
심화 신경망을 이용한 통계모델 기반의 음성 검출 방법 및 이를 수행하는 음성 검출 장치 有权
Title translation: 基于使用深度神经网络的统计模型和执行其的语音活动检测装置的语音活动检测方法

公开(公告)号：KR1020160073874A

公开(公告)日：2016-06-27

申请号：KR1020140182736

申请日：2014-12-17

Applicant: 서울대학교산학협력단 , 한양대학교 산학협력단

Inventor： 장준혁 , 황인영 , 김남수

IPC: G10L25/78 , G10L25/30

CPC classification number: G10L25/78 , G10L25/30

Abstract: 본발명은심화신경망을이용한통계모델기반의음성검출방법및 이를수행하기위한음성검출장치에관한것으로서, 보다구체적으로는음성검출장치가, (1) 학습단계에서, 주변잡음에의해오염된음성신호를입력받고, 입력된음성신호의분산값에기초하여, 사전(a priori) 신호대 잡음비(SNR), 사후(a posteriori) 신호대 잡음비(SNR) 및우도비(likelihood ratio, LR)를이용한특징벡터를추출하는단계; (2) 상기학습단계에서, 상기추출된특징벡터의결과를이용하여, 복수의비선형은닉층을갖는심화신경망의가중치및 바이어스를초기화하여상기심화신경망을선행학습시키는단계; (3) 상기학습단계에서, 상기추출된특징벡터의결과와음성의존재/부재에대한레이블링값을이용하여, 기울기하강기반의역전이알고리즘에기초하여상기심화신경망을최적화시키는단계; 및 (4) 분류단계에서, 상기특징벡터추출방법을통해서얻어진특징벡터로부터상기학습된심화신경망을통해서얻어진결과를이용한결정함수에기초하여, 상기입력된음성신호를음성구간또는잡음구간으로분류하는단계를포함하는것을그 구성상의특징으로한다. 본발명에서제안하고있는심화신경망을이용한통계모델기반의음성검출방법및 이를수행하는음성검출장치에따르면, 학습단계에서, 주변잡음에의해오염된음성신호를입력받고, 입력된음성신호의분산값에기초하여, 사전(a priori) 신호대 잡음비(SNR), 사후(a posteriori) 신호대 잡음비(SNR) 및우도비(likelihood ratio, LR)를이용한특징벡터를추출하며, 상기추출된특징벡터의결과를이용하여, 복수의비선형은닉층을갖는심화신경망의가중치및 바이어스를초기화하여상기심화신경망을선행학습시키고, 상기추출된특징벡터의결과와음성의존재/부재에대한레이블링값을이용하여, 기울기하강기반의역전이알고리즘에기초하여상기심화신경망을최적화시키며, 분류단계에서, 상기특징벡터추출방법을통해서얻어진특징벡터로부터상기학습된심화신경망을통해서얻어진결과를이용한결정함수에기초하여, 상기입력된음성신호를음성구간또는잡음구간으로분류함으로써, 다수의비선형은닉층을이용하여음성이존재하는경우와존재하지않는경우에대한우도비의분포를보다효과적으로모델링할수 있고, 음성검출성능을향상시킬수 있으며, 계산소요시간을감소시킬수 있다.

Abstract translation: 本发明涉及一种基于使用深神经网络的统计模型和执行该神经网络的语音检测装置的语音检测方法。该方法包括以下步骤：（1）使用先验信噪比（SNR），后验信噪比（SNR）和似然比（LR）提取特征向量; （2）提前深入学习神经网络; （3）基于梯度下降计数器转移算法优化深神经网络; 和（4）将输入的语音信号分成语音部分或噪声部分。

32.

发明授权
딥 뉴럴 네트워크 기반 특징 보상 기법을 이용한 음성 인식 방법 有权
Title translation: 使用基于深层神经网络的特征补偿的语音识别方法

公开(公告)号：KR101624926B1

公开(公告)日：2016-05-27

申请号：KR1020140182745

申请日：2014-12-17

Applicant: 서울대학교산학협력단

Inventor： 김남수 , 강신재 , 이강현

IPC: G10L15/16 , G10L15/20 , G10L25/30

CPC classification number: G10L15/16 , G10L15/20 , G10L25/30 , Y10S706/90

Abstract: 본발명은딥 뉴럴네트워크기반특징보상기법을이용한음성인식방법에관한것으로서, 보다구체적으로는 (1) 잡음이혼합된학습데이터를이용해딥 뉴럴네트워크(Deep Neural Network; DNN)를학습하는단계; (2) 테스트데이터를상기학습된딥 뉴럴네트워크에적용하여보상된특징벡터또는스테이트사후확률을도출하는단계; 및 (3) 상기단계 (2)에서도출된보상된특징벡터또는스테이트사후확률을이용해, 음성인식결과를도출하는단계를포함하는것을그 구성상의특징으로한다. 본발명에서제안하고있는딥 뉴럴네트워크기반특징보상기법을이용한음성인식방법에따르면, 잡음이혼합된학습데이터를이용해딥 뉴럴네트워크를학습함으로써, 잡음과깨끗한음성과의관계를자동으로학습할수 있으며, 학습된딥 뉴럴네트워크에테스트데이터를적용하여보상된특징벡터또는스테이트사후확률을도출하고, 이를이용해음성인식결과를도출함으로써, 어떤잡음에서도정확한특징보상이이루어질수 있고, 이를통해향상된음성인식결과를얻을수 있다. 또한, 본발명에따르면, 특징벡터또는스테이트사후확률에대하여딥 뉴럴네트워크를학습하고, 학습된딥 뉴럴네트워크를통해보상된특징벡터또는스테이트사후확률을얻을수 있으므로, 디코더의종류에따라다양한방식으로음성인식에적용될수 있다.

Abstract translation: 本发明涉及一种通过使用基于深神经网络（DNN）的特征补偿技术的语音识别方法。更具体地说，本发明包括：（1）通过使用与噪声混合的学习数据来学习DNN的步骤; （2）通过将测试数据应用于所学习的DNN来计算补偿特征向量或后验状态概率的步骤; 和（3）通过使用在步骤（2）中计算的补偿特征向量或后验状态概率来绘制语音识别结果的步骤。根据通过使用基于本发明提出的DNN的特征补偿技术的语音识别方法，可以通过使用与噪声混合的学习数据学习DNN来自动学习噪声与干净语音之间的关系并用任何噪声进行精确的特征补偿，从而通过将测试数据应用于学习的DNN并通过使用相同的语音识别结果绘制补偿特征向量或后验状态概率来获得改进的语音识别结果。此外，本发明能够根据解码器类型以各种模式应用于语音识别，因为本发明能够根据特征向量或后验状态概率学习DNN，并获得补偿后的特征向量或通过学习的DNN的后验状态概率。

33.

发明授权
마스킹 효과를 고려한 음파 통신 시스템 및 방법, 그리고 이에 적용되는 장치 有权
Title translation: 用于实施具有掩蔽效应的声波通信的系统和方法，以及适用于其的设备

公开(公告)号：KR101432104B1

公开(公告)日：2014-09-23

申请号：KR1020100111522

申请日：2010-11-10

Applicant: 에스케이텔레콤 주식회사 , 서울대학교산학협력단

Inventor： 김문기 , 김동건 , 유재황 , 김민석 , 김남수 , 윤환식 , 조기호

IPC: H04B11/00 , G11B20/10

Abstract: 본 발명은 마스킹 효과를 고려한 음파 통신 시스템 및 방법, 그리고 이에 적용되는 장치를 개시한다. 본 발명에 따른 마스킹 효과를 고려한 음파 통신 시스템은, 음파 통신에 기반한 송수신 과정 중 수신 측에서 발생 가능한 마스킹 효과(Masking Effect)로 인해 오디오 콘텐츠의 음원에 포함된 정보를 검출하는 데에 에러가 일어나는 것을 최소화하기 위한 구성으로 이루어진다. 따라서, 본 발명은 마스킹 효과(Masking Effect)를 감안하여 음원의 품질을 유지하면서도 음파 통신의 수신 측에서 데이터를 용이하게 검출할 수 있도록 한다.

34.

发明授权
가청주파수 대역 음파 통신에서의 데이터 송수신 시스템 및 방법, 그리고 이에 적용되는 장치 有权
Title translation: 用于在基于音频频率基带的声音通信中传送数据的系统和方法，应用于其的设备

公开(公告)号：KR101432099B1

公开(公告)日：2014-08-21

申请号：KR1020100107256

申请日：2010-10-29

Applicant: 에스케이텔레콤 주식회사 , 서울대학교산학협력단

Inventor： 김동건 , 김문기 , 유재황 , 김민석 , 김남수 , 조기호 , 최석재 , 윤환식

IPC: H04B11/00 , H04B1/10

Abstract: 본 발명은 가청주파수 대역 음파 통신에서의 데이터 송수신 시스템 및 방법, 그리고 이에 적용되는 장치를 개시한다. 본 발명에 따른 가청주파수 대역 음파 통신의 데이터 프레임 구현 시스템은, 가청주파수 대역에 기반한 음파 통신의 실행으로 오디오 콘텐츠의 원음에 실어 전송하기 위한 정보의 누락을 방지할 수 있는 데이터 구조를 제시하는 구성으로 이루어진다. 따라서, 본 발명은 채널의 위상 지연 측정을 더 용이하게 할 수 있으므로 음파 통신의 수신 단에서의 채널 이퀄라이저의 성능을 더 높일 수 있으며, LOS(Line Of Sight, 스피커와 마이크가 직선 방향)가 아닌 환경에서도 음파 통신의 전체 성능을 향상시킬 수 있다.

35.

发明公开
마스킹 효과를 고려한 음파 통신 시스템 및 방법, 그리고 이에 적용되는 장치 有权
Title translation: 用于实施具有掩蔽效应的声波通信的系统和方法，以及适用于其的设备

公开(公告)号：KR1020120050155A

公开(公告)日：2012-05-18

申请号：KR1020100111522

申请日：2010-11-10

Applicant: 에스케이텔레콤 주식회사 , 서울대학교산학협력단

Inventor： 김문기 , 김동건 , 유재황 , 김민석 , 김남수 , 윤환식 , 조기호

IPC: H04B11/00 , G11B20/10

CPC classification number: H04B1/665 , H04B1/04 , H04B11/00 , H04B14/004 , H04B2001/0491

Abstract: PURPOSE: A sound wave communication system and a method thereof are provided to minimize errors for detecting information within a sound source of audio content due to masking effect. CONSTITUTION: A transmission unit(100) generates a modulation audio signal which amplitude size is controlled based on a masking threshold value. The transmission unit determines sound variation of the audio signal. The transmission unit re-controls amplitude of a signal band. A reception unit(200) receives an output audio signal. The reception unit outputs information data of the output audio signal.

Abstract translation: 目的：提供一种声波通信系统及其方法，以最小化由于掩蔽效应而检测音频内容的声源内的信息的错误。构成：发送单元（100）生成基于掩蔽阈值来控制振幅大小的调制音频信号。发送单元确定音频信号的声音变化。传输单元重新控制信号频带的幅度。接收单元（200）接收输出音频信号。接收单元输出输出音频信号的信息数据。

36.

发明公开
음성 인식을 위한 전처리 장치, 및 이를 이용한 음성 인식 장치 및 방법 审中-实审
Title translation: 用于语音识别的前端处理器，以及使用该语音识别的装置和语音识别方法

公开(公告)号：KR1020120040649A

公开(公告)日：2012-04-27

申请号：KR1020110098935

申请日：2011-09-29

Applicant: 삼성전자주식회사 , 서울대학교산학협력단

Inventor： 엄기완 , 한창우 , 강태균 , 김남수 , 홍두화 , 이재원 , 임형준

IPC: G10L15/02 , G10L15/28

CPC classification number: G10L19/265 , G10L15/02 , G10L15/28

Abstract: PURPOSE: A pre processing device for voice recognition, a device thereof, and a method thereof are provided to convert the voice of a test environment by a linear dynamic system, thereby increasing the recognition rate of the voice recognition device. CONSTITUTION: A voice input unit divides an first input voice to a fixed frame(S10). A voice converting unit applies conversion rules to the frame of the first voice. The voice converting unit converts the frame of the first voice to a frame of a second voice(S20). A recognizing unit identifies verbal meaning by recognizing frames of the second voice(S30).

Abstract translation: 目的：提供一种用于语音识别的预处理装置，其装置及其方法，用于通过线性动态系统转换测试环境的语音，从而增加语音识别装置的识别率。构成：语音输入单元将第一输入语音划分为固定帧（S10）。语音转换单元将转换规则应用于第一语音的帧。语音转换单元将第一语音的帧转换为第二语音的帧（S20）。识别单元通过识别第二语音的帧来识别语言意义（S30）。

37.

发明公开
가청주파수 대역 음향통신에서의 데이터 수신에러 감소 시스템 및 방법, 그리고 이에 적용되는 장치 有权
Title translation: 用于降低基于频率基带的声音通信中的数据的接收错误的系统和方法，适用于其的装置

公开(公告)号：KR1020110071542A

公开(公告)日：2011-06-29

申请号：KR1020090128146

申请日：2009-12-21

Applicant: 에스케이텔레콤 주식회사 , 서울대학교산학협력단

Inventor： 김동건 , 김문기 , 최근환 , 유재황 , 김민석 , 김남수 , 윤환식 , 조기호

IPC: G10K11/16 , G10L19/005 , G10L21/02

CPC classification number: G10L21/02 , H04B11/00

Abstract: PURPOSE: A system and a method for reducing data reception errors in audible frequency band-based sound communication, and an apparatus applied to the same are provided to improve the reliability of data transmission by employing a bit determination method proper for sound based communication. CONSTITUTION: A system for reducing data reception errors in audible frequency band-based sound communication comprises a transmitter(100) and a receiver(200). The transmitter transmits an audio signal through audible frequency band-based sound communication. The receiver receives an audio signal and converts the signal into a frequency axis signal through the preset conversion method, performs correlation operation for detecting a synchronous signal, presents a data signal on complex number coordinates, groups the data signal values presented on the complex number coordinates, and determines a bit for the data signal based on the groups.

Abstract translation: 目的：提供一种用于减小可听频带的声音通信中的数据接收错误的系统和方法，以及应用于其的装置，通过采用适用于基于声音的通信的比特确定方法来提高数据传输的可靠性。构成：用于在可听频带的声音通信中减少数据接收错误的系统包括发射机（100）和接收机（200）。发射机通过基于声频的频带声音通信发送音频信号。接收机接收音频信号，并通过预设的转换方式将信号转换成频率轴信号，执行检测同步信号的相关运算，呈现复数坐标上的数据信号，对复数坐标上呈现的数据信号进行分组并且基于组确定数据信号的位。

38.

发明授权
음성 몽타주 생성 방법 및 시스템 有权

公开(公告)号：KR102159988B1

公开(公告)日：2020-09-25

申请号：KR1020180167980

申请日：2018-12-21

Applicant: 서울대학교산학협력단

Inventor： 김남수 , 이준엽 , 천성준 , 최병진

IPC: G10L13/033 , G10L25/63 , G10L25/30 , G10L13/08 , G10L25/90 , G10L15/14

39.

发明授权
문맥 정보를 활용한 딥 러닝 기반의 대화체 문장 띄어쓰기 방법 및 시스템 有权

公开(公告)号：KR102086604B1

公开(公告)日：2020-03-09

申请号：KR1020180108009

申请日：2018-09-10

Applicant: 서울대학교산학협력단

Inventor： 김남수 , 조원익

IPC: G06F40/20 , G06N3/08

40.

发明授权
사용자의 사전 이용 정보 분석을 통한 음악 재생 목록 자동 생성 방법 有权

公开(公告)号：KR101968206B1

公开(公告)日：2019-04-11

申请号：KR1020170114789

申请日：2017-09-07

Applicant: 서울대학교산학협력단

Inventor： 김남수 , 김정훈

IPC: G06Q50/10 , G11B20/10

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification