Patent search ap:("서울대학교산학협력단") AND inv:"김남수" Page 1

1.

发明申请
화자 인식을 위한 음성인식기 기반 풀링 기법의 화자 임베딩 추출 방법 및 시스템, 그리고 이를 위한 기록매체 审中-公开

公开(公告)号：WO2022075714A1

公开(公告)日：2022-04-14

申请号：PCT/KR2021/013641

申请日：2021-10-05

Applicant: 서울대학교산학협력단

Inventor： 김남수 , 문성환

IPC: G10L17/02 , G10L17/18 , G10L17/04 , G10L15/26 , G10L15/06

Abstract: 본 발명에서 제안하고 있는 화자 인식을 위한 음성인식기 기반 풀링 기법의 화자 임베딩 추출 방법 및 시스템, 그리고 이를 위한 기록매체에 따르면, 화자 임베딩 추출 과정에서 화자 정보만을 고려하던 기존의 기법들과 달리, 프레임 단위의 출력을 집계하는 과정에서 문자 단위의 개별적 처리 과정을 갖기 때문에 추론 단계에서 화자 임베딩간의 유사도 계산 시 특정 발음 간의 특징 비교를 가능하도록 하며, 이를 통해 화자 인식 시스템에서 화자 정보 및 문장 발화 정보를 동시에 고려하여 비교 분석할 수 있도록 할 수 있다.

2.

发明申请
자연어로 기술되는 스타일 태그를 활용하여 운율 조절이 가능한 멀티 스타일 음성 합성 시스템 审中-公开

公开(公告)号：WO2023033237A1

公开(公告)日：2023-03-09

申请号：PCT/KR2021/015743

申请日：2021-11-03

Applicant: 서울대학교산학협력단

Inventor： 김남수 , 김민찬

IPC: G10L13/10 , G10L13/06 , G10L15/183

Abstract: 본 발명에서 제안하고 있는 자연어로 기술되는 스타일 태그를 활용하여 운율 조절이 가능한 멀티 스타일 음성 합성 시스템에 따르면, 스타일 음성 합성 시 기존의 스타일 라벨이나 참조 음성을 활용함에 따른 발화할 수 있는 스타일 개수의 제한과, 사용자가 발화할 때마다 참조 음성을 찾아 입력해야 하는 번거로움 없이 스타일 태그를 활용하여 사용자가 직관적으로 간편하게 음성의 스타일을 조절할 수 있도록 할 수 있다.

3.

发明申请
비화자 요소에 강인한 화자 임베딩 추출 방법 및 장치, 그리고 이를 위한 기록매체 审中-公开

公开(公告)号：WO2022054994A1

公开(公告)日：2022-03-17

申请号：PCT/KR2020/012348

申请日：2020-09-11

Applicant: 서울대학교산학협력단

Inventor： 김남수 , 강우현

IPC: G10L17/02 , G10L17/18 , G10L17/04 , G10L19/038 , G10L15/06 , G10L15/08 , G06N3/08

Abstract: 본 발명에서 제안하고 있는 비화자 요소에 강인한 화자 임베딩 추출 방법 및 장치, 그리고 이를 위한 기록매체에 따르면, 화자 분류기만을 학습하는 기존 방식의 기법들과 달리, 화자 임베딩 추출 과정에서 비 화자 요소에 대한 정보가 감소하도록 임베딩 시스템을 학습하고, 화자 임베딩은 화자에 대한 정보는 높이되, 비화자 요소에 대한 정보는 최소화되도록 학습됨에 따라 얻어진 화자 임베딩은 보다 비화자 정보로 인한 성능 열화가 최소화되고, 그에 따른 비화자 요소에 강인한 화자 임베딩 추출이 가능하도록 할 수 있다.

4.

发明授权
딥 뉴럴 네트워크를 이용한 음성 인식 방법 및 시스템 有权

公开(公告)号：KR102066264B1

公开(公告)日：2020-01-14

申请号：KR1020180078439

申请日：2018-07-05

Applicant: 서울대학교산학협력단

Inventor： 김남수 , 이강현

IPC: G10L15/16 , G10L15/14 , G10L15/06 , G06N3/08

5.

发明授权
사용자의 HRTF 정보를 이용하여 N채널의 음원을 사용자에 최적화된 바이노럴 음원으로 다운 믹스하는 방법 및 시스템 有权
Title translation: 一种使用用户的HRTF信息将N声道声源下混合到用户优化的双耳声源的方法和系统

公开(公告)号：KR101725952B1

公开(公告)日：2017-04-11

申请号：KR1020150183238

申请日：2015-12-21

Applicant: 서울대학교산학협력단

Inventor： 김남수 , 박경수 , 김정훈 , 천성준

IPC: H04S3/00 , H04R5/033

Abstract: 본발명은사용자의 HRTF 정보를이용하여 N채널의음원을사용자에최적화된바이노럴음원으로다운믹스하는방법에관한것으로서, 보다구체적으로는 (1) 사인스윕신호를 N채널의스피커를통해재생시키고, 상기재생된신호가사용자의양쪽귀에장착된마이크에녹음되는단계(S100), (2) 상기단계 (1)에서녹음된신호로부터양쪽각각의귀마다 N개의사용자 HRTF 정보가추출되는단계(S200), 및 (3) 상기단계 (2)로부터양쪽각각의귀마다추출된 N개의사용자 HRTF 정보와 N채널의원 음원신호가합성되어바이노럴음원이생성되는단계(S300)를포함하는것을그 구성상의특징으로한다. 본발명에서제안하고있는사용자의 HRTF 정보를이용하여 N채널의음원을사용자에최적화된바이노럴음원으로다운믹스하는방법및 시스템에따르면, 사용자의 HRTF 정보를이용하여바이노럴음원을생성함으로써, 사용자의청각특성을반영하여사용자에게최적화된바이노럴음원을만들수 있다.

Abstract translation: 本发明涉及一种使用用户的HRTF信息将N声道声源缩混成用户优化的双耳声源的方法，更具体地，本发明涉及（1）（S100），将再现信号记录到安装在用户两耳上的麦克风;（2）从步骤（1）中记录的信号的两侧提取每个耳朵的N个用户HRTF信息; （3）步骤S300，其中通过合成从步骤（2）提取给两耳的N个用户HRTF信息和N个声道声源信号来生成双耳声源，这是配置的一个特点。根据用于使用本发明提出的HRTF信息将N声道声源缩混成用户优化的双耳声源的方法和系统，使用用户的HRTF信息生成双耳声源通过反映用户的听觉特性，可以为用户制作最优化的双耳声源。

6.

发明公开
파라미터 변경에 의해 음색을 변환하는 사용자 맞춤형 음성 보정 방법 및 이를 구현하는 음성 보정 장치 有权
Title translation: 用户可自定义的语音修改方法通过参数修改语音和语音修改设备实现相同

公开(公告)号：KR1020160128871A

公开(公告)日：2016-11-08

申请号：KR1020150060946

申请日：2015-04-29

Applicant: 서울대학교산학협력단

Inventor： 김남수 , 권기수 , 배수현 , 강우현

IPC: G10L13/033 , G10L21/02

Abstract: 본발명은파라미터변경에의해음색을변환하는사용자맞춤형음성보정방법및 이를구현하는음성보정장치에관한것으로서, 보다구체적으로는, 사용자맞춤형음성보정장치가, (1) 원시음성데이터를입력받는단계; (2) 상기입력된원시음성데이터로부터피치, 특성파형(CW), 파워및 선스펙트럼주파수(LSF)를포함한음성파라미터들을추출하는단계; (3) 상기추출된음성파라미터들에대해, 미리설정된복수의특이음성이갖는제1 특징들을미리설정된정상음성이갖는제2 특징들로변경하는단계; 및 (4) 상기변경된제2 특징을갖는음성파라미터들에기초하여, 보정된음성데이터를합성하는단계를포함하는것을그 구성상의특징으로한다. 본발명에서제안하고있는파라미터변경에의해음색을변환하는사용자맞춤형음성보정방법및 이를구현하는음성보정장치에따르면, 사용자맞춤형음성보정장치가, 원시음성데이터를입력받고, 입력된원시음성데이터로부터피치, 특성파형(CW), 파워및 선스펙트럼주파수(LSF)를포함한음성파라미터들을추출하며, 추출된음성파라미터들에대해, 미리설정된복수의특이음성이갖는제1 특징들을미리설정된정상음성이갖는제2 특징들로변경하고, 변경된제2 특징을갖는음성파라미터들에기초하여, 보정된음성데이터를합성함으로써, 쉰(hoarse) 음성, 거친(rough) 음성, 숨찬(breathy) 음성및 비음(nasal) 음성과같은특이목소리를분석및 개선할수 있고, 음색을차가운느낌또는따뜻한느낌으로변경할수 있다. 또한, 음성통화를통해식별되기어려운음성이나화자가갖고있는불만족스러운음성을, 또렷하거나원하는음색의음성으로변경할수 있게하고, 화자가갖는발성기관의신체적문제를보조할수 있으며, 사용자가어필하고싶은음색의음성을생성하게함으로써, 사용자의욕구에맞추어다양하게음성을보정할수 있다.

7.

发明授权
주파수 또는 시간적 상관관계를 반영한 잡음 제거 방법 및 시스템 有权
Title translation: 基于光谱和时间关联的减少噪声的方法和系统

公开(公告)号：KR101537653B1

公开(公告)日：2015-07-17

申请号：KR1020130167932

申请日：2013-12-31

Applicant: 서울대학교산학협력단

Inventor： 김남수 , 진유광

IPC: G10L21/0208

Abstract: 본발명은잡음제거방법및 시스템에관한것으로서, 보다구체적으로는 (1) 적어도하나이상의마이크로부터음향신호를입력받는단계; (2) 상기단계 (1)에서입력받은음향신호에현재주파수또는현재시간과미리정해진범위로인접한주파수축또는시간축스펙트럼을통합하여확장된벡터를생성하는단계; 및 (3) 상기확장된벡터를잡음제거필터를통해신호처리하여잡음이제거된음향신호를도출하는단계를포함하는것을그 구성상의특징으로한다. 본발명에서제안하고있는주파수또는시간적상관관계를반영한잡음제거방법및 시스템에따르면, 입력받은음향신호에현재주파수또는현재시간과미리정해진범위로인접한주파수축또는시간축스펙트럼을통합하여확장된벡터를생성하고, 확장된벡터를잡음제거필터를통해신호처리하여잡음이제거된음향신호를도출함으로써, 현재주파수와현재시간의입력신호뿐 아니라지난시간과인접한주파수의입력신호성분들을총체적으로고려하여보다정확하고효과적인잡음제거가가능하다. 또한, 본발명에따르면, 확장된벡터에대한 PSD(Power Spectral Density) 행렬을연산하고, 미리정해진파라미터화된필터를연산된 PSD 행렬에적용하여잡음이제거된음향신호를도출하되, PSD(Power Spectral Density) 행렬은, PSD 행렬에기반하여추정된음성존재확률(SPP)을이용하여매 프레임마다업데이트함으로써, 더욱안정적으로잡음제거가가능하다.

8.

发明授权
오디오 신호의 보존에 기초한 음파 통신에서 정보 송수신 시스템 및 방법, 그리고 이에 적용되는 장치 有权
Title translation: 基于保存音频信号的声波通信中的信息传送系统和方法及其应用

公开(公告)号：KR101462427B1

公开(公告)日：2014-11-17

申请号：KR1020100111573

申请日：2010-11-10

Applicant: 에스케이텔레콤 주식회사 , 서울대학교산학협력단

Inventor： 김문기 , 김동건 , 유재황 , 김민석 , 김남수

IPC: H04B11/00 , G11B20/10

Abstract: 본 발명은 오디오 신호의 보존에 기초한 음파 통신에서 정보 송수신 시스템 및 방법, 그리고 이에 적용되는 장치를 개시한다. 본 발명에 따른 오디오 신호의 보존에 기초한 음파 통신에서 정보 송수신 시스템은, 가청주파수 대역에서 원래 음원의 손상이 없이 사람의 귀에 들리지 않게 데이터를 삽입하여 오디오 콘텐츠를 이용한 음파 통신을 하기 위한 구성으로 이루어진다. 따라서, 본 발명은 기존의 TV/라디오 방송망 및 사설 구내방송 등의 기존 시설에 대한 변경 없이 오디오 콘텐츠 기반의 부가 데이터를 휴대폰 등과 같은 개인 음향기기로 전달할 수 있으며, 오디오 콘텐츠에 대한 원음에 대한 손상을 최대한으로 줄이면서 음파 통신으로 데이터를 전달할 수 있다.

9.

发明授权
캐터필러와 주행휠을 구비한 이동로봇 有权
Title translation: 混合机动车

公开(公告)号：KR101248978B1

公开(公告)日：2013-04-02

申请号：KR1020120005613

申请日：2012-01-18

Applicant: 서울대학교산학협력단

Inventor： 김종원 , 최동규 , 장도영 , 김남수 , 오종균 , 이석우

IPC: B25J5/00 , B62D55/075

CPC classification number: B25J5/00 , B25J5/005 , B25J5/007 , B62D55/02 , B62D55/075 , B62D57/024

Abstract: PURPOSE: A mobile robot with a caterpillar and a driving wheel is provided to enhance energy efficiency by preventing unnecessary use of power when driving. CONSTITUTION: A mobile robot with a caterpillar and a driving wheel comprises a body unit(100), a main wheel support board(200), an auxiliary wheel support board(300), a first driving wheel(410), a driving caterpillar(430), a second driving wheel(420), a first driving motor, a caterpillar assembly motor, a caterpillar driving motor, a second driving motor, and a control unit. The caterpillar assembly motor assembles the driving caterpillar. The control unit controls operation of the first driving motor, the caterpillar assembly motor, the caterpillar driving motor, and the second driving motor.

Abstract translation: 目的：提供具有履带式和驱动轮的移动式机器人，通过在驾驶时不必要地使用电力来提高能源效率。构成：具有履带和驱动轮的移动机器人包括主体单元（100），主轮支撑板（200），辅助轮支撑板（300），第一驱动轮（410），驾驶履带 430），第二驱动轮（420），第一驱动马达，履带总成马达，履带驱动马达，第二驱动马达和控制单元。卡特彼勒组装电机组装驾驶履带。控制单元控制第一驱动马达，履带式马达，履带驱动马达和第二驱动马达的运转。

10.

发明公开
음향 신호 품질 개선 장치 및 방법 有权
Title translation: 音频信号质量改进设备和方法

公开(公告)号：KR1020130025552A

公开(公告)日：2013-03-12

申请号：KR1020110088928

申请日：2011-09-02

Applicant: 에스케이텔레콤 주식회사 , 서울대학교산학협력단

Inventor： 김동건 , 박성수 , 김문기 , 이상신 , 정구익 , 유재황 , 김남수 , 조기호 , 최석재

IPC: H04L27/00

CPC classification number: G10L21/0232

Abstract: PURPOSE: A sound quality improvement device and a method thereof are provided to minimize quality degradation generated by inserting data into an original sound signal. CONSTITUTION: A sound signal quality improvement device(110) includes a coefficient calculation unit(111), a size calculation unit(112), a phase value storage unit(113), and a quality correcting unit(114). The coefficient calculation unit calculates the frequency conversion coefficient of a sound signal by converting frequencies for the original sound signal and the sound signal including data. A size calculation unit calculates the size of a frequency conversion coefficient in the sound signal including the data and the frequency conversion coefficient of the original sound signal. The phase value storage unit stores the phase value of the sound signal including the data. The quality correcting unit corrects the quality of the sound signal including the data based on the phase value and size of the frequency coefficient of the sound signal. [Reference numerals] (111) Coefficient calculation unit; (112) Size calculation unit; (113) Phase value storage unit; (114) Quality correcting unit; (115) SNR calculation unit; (116) Adjusting unit; (117) Converting unit

Abstract translation: 目的：提供一种音质改善装置及其方法，以最小化将数据插入到原始声音信号中产生的质量劣化。声音信号质量改善装置（110）包括系数计算单元（111），尺寸计算单元（112），相位值存储单元（113）和质量校正单元（114）。系数计算单元通过转换原始声音信号的频率和包括数据的声音信号来计算声音信号的频率转换系数。尺寸计算单元计算包括原始声音信号的数据和频率转换系数的声音信号中的频率转换系数的大小。相位值存储单元存储包括数据的声音信号的相位值。质量校正单元基于声音信号的频率系数的相位值和大小来校正包括数据的声音信号的质量。（参考号）（111）系数计算单元; （112）尺寸计算单位; （113）相位值存储单元; （114）质量纠正单元; （115）SNR计算单元; （116）调整单元; （117）转换单元

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification