가청주파수 대역 음향통신 송수신에서의 동기화 시스템 및 방법, 그리고 이에 적용되는 장치
    51.
    发明公开
    가청주파수 대역 음향통신 송수신에서의 동기화 시스템 및 방법, 그리고 이에 적용되는 장치 有权
    用于同步基于音频基带的声音通信的系统和方法,适用于其的设备

    公开(公告)号:KR1020110069425A

    公开(公告)日:2011-06-23

    申请号:KR1020090126154

    申请日:2009-12-17

    CPC classification number: G10L19/018

    Abstract: PURPOSE: A synchronization system for transmitting audible frequency band acoustic communication and method thereof are provided to prevent the deterioration of synchronization capability and to obtain various sample units. CONSTITUTION: A transmitter(100) converts the time axis signal of an audio signal into a frequency axis signal according to the conversion of a first mode. The transmitter varies the phase of preset frequency corresponding to synchronizing data. The transmitter converts an audio signal of a frequency axis signal to a time axis signal according to a first reverse conversion method. A receiver(200) converts an audio signal of a reversely converted time axis signal into a frequency axis signal according to a second reverse conversion method. The receiver determines a synchronization location from a correlation value.

    Abstract translation: 目的:提供一种用于发送可听频段声通信的同步系统及其方法,以防止同步能力的恶化并获得各种采样单元。 构成:发送器(100)根据第一模式的转换将音频信号的时间轴信号转换为频率轴信号。 发射机改变与同步数据相对应的预设频率的相位。 发射机根据第一反向转换方法将频率轴信号的音频信号转换为时间轴信号。 接收机(200)根据第二反向转换方法将反向转换的时间轴信号的音频信号转换成频率轴信号。 接收机根据相关值确定同步位置。

    언어 모델링을 이용한 4성부 합창 악보 생성 방법 및 시스템

    公开(公告)号:KR101900020B1

    公开(公告)日:2018-09-18

    申请号:KR1020170114664

    申请日:2017-09-07

    Inventor: 김남수 조원익

    CPC classification number: G10H1/0025 G10H2210/031 G10H2210/111 G10H2250/005

    Abstract: 본발명은언어모델링을이용한 4성부합창악보생성방법에관한것으로서, 보다구체적으로는 4성부로구성된 4성부합창악보를자동으로생성하는방법에있어서, (1) 4성부중 적어도한 성부의조성정보를포함하는멜로디를입력받는단계; (2) 상기단계 (1)에서입력받은멜로디의조성정보에따른화음을포함하는노트후보가생성되는단계; (3) 조성에독립적인성분들을포함한조성-독립적인특징을가지는입력데이터로언어모델링이학습되는단계; (4) 상기단계 (3)에서학습된언어모델링을통해예측되는화음의조성-독립적인특징과상기단계 (2)에서생성된노트후보의특징을비교하여점수가부여되고, 점수가가장높은노트후보가선택되는단계; 및 (5) 상기단계 (4)를반복하여선택된노트후보로부터 4성부합창악보가생성되는단계를포함하는것을그 구성상의특징으로한다. 또한, 본발명은언어모델링을이용한 4성부합창악보생성시스템에관한것으로서, 보다구체적으로는 4성부로구성된 4성부합창악보를자동으로생성하는시스템에있어서, 4성부중 적어도한 성부의조성정보를포함하는멜로디를입력받는입력부; 상기입력부에서입력받은멜로디의조성정보에따른화음을포함하는노트후보를생성하는노트후보생성부; 조성에독립적인성분들을포함한조성-독립적인특징을가지는입력데이터로언어모델링을학습시키는학습부; 상기학습부에서학습된언어모델링을통해예측되는화음의조성-독립적인특징과상기노트후보생성부에서생성한노트후보의특징을비교하여점수를부여하고, 점수가가장높은노트후보를선택하는노트후보선택부; 및상기노트후보선택부의선택을반복하여선택한노트후보로부터 4성부합창악보를생성하는 4성부합창악보생성부를포함하는것을그 구성상의특징으로한다. 본발명에서제안하고있는언어모델링을이용한 4성부합창악보생성방법및 시스템에따르면, 정규화된화음정보를언어모델링에서사용되는토큰들처럼생각하고, 특정도수의화음을품사로생각하여통계적방법론을적용함으로써, 특정성부의멜로디와조성을받아다른세 성부를완성시켜합창악보를생성할수 있으며, 화성학을배우지않은일반인들도곡의일부를생각해낼수 있다면 4성부합창음악을완성할수 있다. 또한, 본발명에서제안하고있는언어모델링을이용한 4성부합창악보생성방법및 시스템에따르면, 언어모델링이학습됨으로써, 기존의규칙기반 4성부합창음악생성방법보다자연스러운화성진행을구현할수 있고, 도수정보를도수정보로정규화하여사용함으로써, 적은데이터를이용해훨씬효율적으로모델링학습이이루어질수 있다.

    VAE를 이용한 화자 인식 특징 추출 방법 및 시스템
    54.
    发明授权
    VAE를 이용한 화자 인식 특징 추출 방법 및 시스템 有权
    使用VAE的说话人识别特征提取方法和系统

    公开(公告)号:KR101843074B1

    公开(公告)日:2018-03-28

    申请号:KR1020160130100

    申请日:2016-10-07

    Inventor: 김남수 강우현

    CPC classification number: G10L17/02 G10L19/038

    Abstract: 본발명은 VAE를이용한화자인식특징추출방법에관한것으로서, 보다구체적으로는 (1) 복수개의음성파일들로구성된학습데이터를사용하여화자독립적모델인일반배경모델(universal background model, UBM)을학습하는단계; (2) 상기단계 (1)에서학습된일반배경모델을이용하여상기복수개의음성파일들에서의 Baum-Welch statistics를추출하고, 상기추출된 Baum-Welch statistics에기초하여하나의통합벡터를생성하는단계; (3) 상기단계 (2)에서생성된하나의통합벡터를입력벡터로하여 VAE를학습하는단계; 및 (4) 상기단계 (3)에서의학습결과를바탕으로딥 러닝(deep learning) 구조를생성하여상기입력벡터를재구성하는과정에서생성되는랜덤변수(latent variables)를화자인식특징으로추출하는단계를포함하는것을그 구성상의특징으로한다. 또한, 본발명은 VAE를이용한화자인식특징추출시스템에관한것으로서, 보다구체적으로는복수개의음성파일들로구성된학습데이터를사용하여화자독립적모델인일반배경모델(universal background model, UBM)을학습하는 UBM 학습부; 상기 UBM 학습부에서학습된일반배경모델을이용하여상기복수개의음성파일들에서의 Baum-Welch statistics를추출하고, 상기추출된 Baum-Welch statistics에기초하여하나의통합벡터를생성하는 Baum-Welch statistics 추출부; 상기 Baum-Welch statistics 추출부에서생성된하나의통합벡터를입력벡터로하여 VAE를학습하는 VAE 학습부; 및상기 VAE 학습부에서의학습결과를바탕으로딥 러닝(deep learning) 구조를생성하여상기입력벡터를재구성하는과정에서생성되는랜덤변수(latent variables)를화자인식특징으로추출하는화자인식특징추출부를포함하는것을그 구성상의특징으로한다. 본발명에서제안하고있는 VAE를이용한화자인식특징추출방법및 시스템에따르면, 입력된벡터를여러은닉층을통과시켜출력에서재구성하는딥 러닝(deep learning) 구조인오토인코더(autoencoder)의일종으로, 가운데은닉층에랜덤변수들을가지고있는구조를갖는 variational auto encoder(VAE)를이용하되, VAE의구조중 입력층과은닉층으로구성되는인코더네트워크를화자인식특징추출기로활용하고, 입력벡터를재구성하는과정에서얻어지는랜덤변수들을화자인식특징으로사용함으로써, 보다비관측데이터에대해서도강인하고안정적인고정된차원의특징을추출할수 있어, 화자인식의성능이보다높아질수 있다.

    Abstract translation: 本发明涉及一种使用该VAE的扬声器识别的特征提取方法,更具体地,(1)使用由多个声音的学习数据文件说话者无关模型普通的背景模型(通用背景模型,UBM),学习 该方法包括: (2)使用的一般背景模型在上述步骤(1)学习以提取从所述多个音频文件的的Baum-韦尔奇统计,并基于所提取的Baum-韦尔奇统计单个集成矢量 步骤; (3)通过使用步骤(2)中生成的一个积分向量作为输入向量来学习VAE; 并且(4)通过基于步骤(3)中的学习结果生成深度学习结构,利用说话者识别特征来提取在重构输入矢量的过程中生成的潜变量, 并包括其构成特征。 本发明涉及使用VAE的说话人识别特征提取系统,更具体地,涉及使用VAE的说话人识别特征提取系统, 学习部门; 使用一般背景模型在UBM学习单元学习提取从多个音频文件的的Baum-韦尔奇统计,所提取的Baum-韦尔奇统计基于综合向量的Baum-韦尔奇统计生成一个 提取单元; VAE学习单元,其通过使用由Baum-Welch统计提取单元生成的一个集成向量作为输入向量来学习VAE; 以及说话人识别特征提取单元,用于通过基于VAE学习单元中的学习结果生成深度学习结构来提取在通过说话人识别特征重建输入向量的过程中生成的潜在变量 等等。 出根据该说话人识别的特征提取的方法和系统使用VAE本发明中提出,其中的输入矢量是通过一些在输出重构的隐藏层的传递的类型深学习(深学习)与自动编码器(自动编码)结构, 但使用具有结构与随机变量到隐藏层,以及利用该编码器网络包括输入层与VAE的扬声器识别特征提取器的结构的隐藏层的变分自动编码器(VAE),在重建输入向量的过程中获得 通过使用随机变量作为说话人识别特征,即使对于未观察到的数据也可以提取稳健且稳定的固定维度特征,并且可以增强说话人识别性能。

    마이크로폰과 라우드 스피커 쌍의 왜곡 제거를 위한 임펄스 응답 측정 방법
    55.
    发明授权
    마이크로폰과 라우드 스피커 쌍의 왜곡 제거를 위한 임펄스 응답 측정 방법 有权
    用于补偿麦克风扬声器对失真的脉冲响应测量方法

    公开(公告)号:KR101664950B1

    公开(公告)日:2016-10-12

    申请号:KR1020140182746

    申请日:2014-12-17

    Abstract: 본발명은마이크로폰과라우드스피커쌍의왜곡제거를위한임펄스응답측정방법에관한것으로서, 보다구체적으로는라우드스피커, 마이크로폰및 음향공간으로구성되는음향시스템에서임펄스응답측정방법으로서, (1) 입력신호를생성하는단계; (2) 상기라우드스피커가상기음향공간에상기단계 (1)에서생성된입력신호를재생하는동시에, 재생되는소리를상기마이크로폰이녹음을수행하여, 동기화된 입력및 출력을획득하는단계; 및 (3) 역필터링을통해, 상기단계 (2)에서획득한입력및 출력으로부터상기마이크로폰과라우드스피커쌍의임펄스응답을측정하는단계를포함하는것을그 구성상의특징으로한다. 본발명에서제안하고있는마이크로폰과라우드스피커쌍의왜곡제거를위한임펄스응답측정방법에따르면, 라우드스피커가음향공간에입력신호를재생하는동시에, 재생되는소리를마이크로폰으로녹음하여입력및 출력을획득하고, 역필터링을통해입력및 출력으로부터마이크로폰과라우드스피커쌍의임펄스응답을측정함으로써, 마이크로폰과라우드스피커쌍에의한왜곡을효과적으로제거할수 있다. 또한, 본발명에따르면, 사인파형의스윕신호를생성하여입력신호로사용함으로써, 마이크로폰과라우드스피커에의한비선형적인왜곡특성을보다정확하게측정할수 있으며, 이를통해임펄스응답을이용한왜곡보상성능을향상시킬수 있다.

    심화 신경망을 이용한 통계모델 기반의 음성 검출 방법 및 이를 수행하는 음성 검출 장치
    56.
    发明授权
    심화 신경망을 이용한 통계모델 기반의 음성 검출 방법 및 이를 수행하는 음성 검출 장치 有权
    基于使用深度神经网络的统计模型和执行其的语音活动检测装置的语音活动检测方法

    公开(公告)号:KR101640188B1

    公开(公告)日:2016-07-15

    申请号:KR1020140182736

    申请日:2014-12-17

    Abstract: 본발명은심화신경망을이용한통계모델기반의음성검출방법및 이를수행하기위한음성검출장치에관한것으로서, 보다구체적으로는음성검출장치가, (1) 학습단계에서, 주변잡음에의해오염된음성신호를입력받고, 입력된음성신호의분산값에기초하여, 사전(a priori) 신호대 잡음비(SNR), 사후(a posteriori) 신호대 잡음비(SNR) 및우도비(likelihood ratio, LR)를이용한특징벡터를추출하는단계; (2) 상기학습단계에서, 상기추출된특징벡터의결과를이용하여, 복수의비선형은닉층을갖는심화신경망의가중치및 바이어스를초기화하여상기심화신경망을선행학습시키는단계; (3) 상기학습단계에서, 상기추출된특징벡터의결과와음성의존재/부재에대한레이블링값을이용하여, 기울기하강기반의역전이알고리즘에기초하여상기심화신경망을최적화시키는단계; 및 (4) 분류단계에서, 상기특징벡터추출방법을통해서얻어진특징벡터로부터상기학습된심화신경망을통해서얻어진결과를이용한결정함수에기초하여, 상기입력된음성신호를음성구간또는잡음구간으로분류하는단계를포함하는것을그 구성상의특징으로한다. 본발명에서제안하고있는심화신경망을이용한통계모델기반의음성검출방법및 이를수행하는음성검출장치에따르면, 학습단계에서, 주변잡음에의해오염된음성신호를입력받고, 입력된음성신호의분산값에기초하여, 사전(a priori) 신호대 잡음비(SNR), 사후(a posteriori) 신호대 잡음비(SNR) 및우도비(likelihood ratio, LR)를이용한특징벡터를추출하며, 상기추출된특징벡터의결과를이용하여, 복수의비선형은닉층을갖는심화신경망의가중치및 바이어스를초기화하여상기심화신경망을선행학습시키고, 상기추출된특징벡터의결과와음성의존재/부재에대한레이블링값을이용하여, 기울기하강기반의역전이알고리즘에기초하여상기심화신경망을최적화시키며, 분류단계에서, 상기특징벡터추출방법을통해서얻어진특징벡터로부터상기학습된심화신경망을통해서얻어진결과를이용한결정함수에기초하여, 상기입력된음성신호를음성구간또는잡음구간으로분류함으로써, 다수의비선형은닉층을이용하여음성이존재하는경우와존재하지않는경우에대한우도비의분포를보다효과적으로모델링할수 있고, 음성검출성능을향상시킬수 있으며, 계산소요시간을감소시킬수 있다.

    마이크로폰과 라우드 스피커 쌍의 왜곡 제거를 위한 임펄스 응답 측정 방법
    57.
    发明公开
    마이크로폰과 라우드 스피커 쌍의 왜곡 제거를 위한 임펄스 응답 측정 방법 有权
    用于补偿麦克风扬声器对失真的脉冲响应测量方法

    公开(公告)号:KR1020160074751A

    公开(公告)日:2016-06-29

    申请号:KR1020140182746

    申请日:2014-12-17

    CPC classification number: H04R29/00 G01H3/00 H04R29/001

    Abstract: 본발명은마이크로폰과라우드스피커쌍의왜곡제거를위한임펄스응답측정방법에관한것으로서, 보다구체적으로는라우드스피커, 마이크로폰및 음향공간으로구성되는음향시스템에서임펄스응답측정방법으로서, (1) 입력신호를생성하는단계; (2) 상기라우드스피커가상기음향공간에상기단계 (1)에서생성된입력신호를재생하는동시에, 재생되는소리를상기마이크로폰이녹음을수행하여, 동기화된 입력및 출력을획득하는단계; 및 (3) 역필터링을통해, 상기단계 (2)에서획득한입력및 출력으로부터상기마이크로폰과라우드스피커쌍의임펄스응답을측정하는단계를포함하는것을그 구성상의특징으로한다. 본발명에서제안하고있는마이크로폰과라우드스피커쌍의왜곡제거를위한임펄스응답측정방법에따르면, 라우드스피커가음향공간에입력신호를재생하는동시에, 재생되는소리를마이크로폰으로녹음하여입력및 출력을획득하고, 역필터링을통해입력및 출력으로부터마이크로폰과라우드스피커쌍의임펄스응답을측정함으로써, 마이크로폰과라우드스피커쌍에의한왜곡을효과적으로제거할수 있다. 또한, 본발명에따르면, 사인파형의스윕신호를생성하여입력신호로사용함으로써, 마이크로폰과라우드스피커에의한비선형적인왜곡특성을보다정확하게측정할수 있으며, 이를통해임펄스응답을이용한왜곡보상성능을향상시킬수 있다.

    Abstract translation: 本发明涉及一种测量脉冲响应以消除麦克风 - 扬声器对的失真的方法,更具体地,涉及一种在包括扬声器,麦克风和声学空间的声学系统中测量脉冲响应的方法 。 该方法包括:产生输入信号的步骤(1); 通过在通过所述麦克风记录所播放的声音的同时通过所述扬声器在声学空间中播放在步骤(1)生成的输入信号来获得同步输入和输出的步骤(2) 以及步骤(3),其通过反向滤波来从步骤(2)获得的输入和输出中测量一对麦克风和扬声器的脉冲响应。 根据用于测量脉冲响应的方法,由于扬声器在声学空间中播放输入信号,同时麦克风记录所播放的声音以获得输入和输出,然后测量一对麦克风和扬声器的脉冲响应 通过反向滤波的输入和输出,麦克风 - 扬声器对的失真被有效地去除。 此外,根据本发明,该方法能够通过产生和使用正弦波扫描信号作为输入信号来精确地测量麦克风和扬声器的非线性失真特性,从而通过使用脉冲响应来改善失真补偿性能。

    스위칭 선형 동적 시스템을 활용한 통계적 음성 합성 시스템의 음성 합성 방법
    58.
    发明授权
    스위칭 선형 동적 시스템을 활용한 통계적 음성 합성 시스템의 음성 합성 방법 有权
    使用切换线性动态系统的统计语音合成系统的语音合成方法

    公开(公告)号:KR101145441B1

    公开(公告)日:2012-05-15

    申请号:KR1020110036463

    申请日:2011-04-20

    Abstract: PURPOSE: A method for combining sounds of a statistical speech combining system using a switching linear dynamic system is provided to apply a voice database and a switching linear dynamic system which learns an existing education system, thereby combining voices. CONSTITUTION: A system learns a statistical model from a voice database. The system learns a system parameter of a switching linear dynamic system using an ML(Maximum Likelihood) method(S100). The system selects a statistical model and a converter corresponding to an input sentence or an input word. The system uses a learnt statistical model value as an input value. The system combines voices which are from a combined feature vector of the switching linear dynamic system(S200).

    Abstract translation: 目的:提供一种使用切换线性动态系统组合统计语音组合系统的声音的方法,以应用语音数据库和学习现有教育系统的切换线性动态系统,从而组合语音。 构成:系统从语音数据库学习统计模型。 该系统使用ML(最大似然)方法(S100)学习切换线性动态系统的系统参数。 系统选择对应于输入语句或输入单词的统计模型和转换器。 系统使用学习的统计模型值作为输入值。 该系统组合了来自开关线性动态系统(S200)的组合特征向量的语音。

    로봇용 다리 및 이를 구비한 로봇.
    60.
    发明公开
    로봇용 다리 및 이를 구비한 로봇. 有权
    具有机器人和机器人的机器人

    公开(公告)号:KR1020120040445A

    公开(公告)日:2012-04-27

    申请号:KR1020100101874

    申请日:2010-10-19

    Abstract: PURPOSE: Legs for a robot and a robot having the same are provided to instantaneously transfer impact because legs are adjusted at the same time while legs are swung with respect to a robot body through first and second members and a crank structure. CONSTITUTION: Legs(100) for a robot comprises first and second members(10,20), a crankshaft(31), a crank arm(32), and a connection rod(34). The first member is joined to a body of a robot to be rotated. The second member is joined to the first member and linearly reciprocates. The crankshaft is joined to be rotated with respect to the first member. One end part of the connecting rod is joined to the other end part of the crank arm to be rotated and the other end part of the connecting rod is joined to be rotated with respect to the second member.

    Abstract translation: 目的:提供用于机器人的腿部和具有该机器人的机器人以瞬时转移冲击力,因为腿部通过第一和第二构件和曲柄结构相对于机器人本体摆动而同时被调节。 构成:用于机器人的腿(100)包括第一和第二构件(10,20),曲轴(31),曲柄臂(32)和连接杆(34)。 第一个构件被连接到要旋转的机器人的主体。 第二构件连接到第一构件并且线性往复运动。 曲轴接合以相对于第一构件旋转。 连杆的一端部与曲柄臂的另一端部接合以旋转,连杆的另一端部相对于第二部件旋转。

Patent Agency Ranking