천이구간 부호화 왜곡에 강인한 오디오 부호화/복호화 장치 및 방법

    公开(公告)号:WO2022010189A1

    公开(公告)日:2022-01-13

    申请号:PCT/KR2021/008417

    申请日:2021-07-02

    Abstract: 천이구간 부호화 왜곡에 강인한 오디오 부호화/복호화 장치 및 방법이 개시된다. 오디오 부호화 방법은 입력 신호를 T/F(time-to-frequency) 변환하여 주파수 영역 신호를 출력하는 단계; 상기 주파수 영역 신호에 FDNS(frequency domain noise shaping) 부호화를 적용하여 상기 주파수 영역 신호에서 주파수축 포락선이 제거된 주파수 영역 잔차 신호를 출력하는 단계; 상기 주파수 영역 잔차 신호를 기초로 LPC(linear prediction coefficient) 분석을 수행하여 시간축 포락선이 제거된 시간 영역 잔차 신호를 출력하는 단계; 및 상기 시간 영역 잔차 신호를 양자화하여 전송하는 단계를 포함할 수 있다.

    구간 가중치 검출을 이용한 오디오 인식 장치 및 방법
    3.
    发明公开
    구간 가중치 검출을 이용한 오디오 인식 장치 및 방법 审中-实审
    使用间隔加权检测的音频识别装置和方法

    公开(公告)号:KR1020170095644A

    公开(公告)日:2017-08-23

    申请号:KR1020160017348

    申请日:2016-02-15

    Inventor: 임우택

    Abstract: 본발명에따른구간가중치검출을이용한오디오인식장치는신경망(뉴럴네트워크)를이용한오디오인식장치로서, 오디오입력에구간별가중치검출알고리즘을적용하여가중치를다르게적용하여오디오신호를인식한다. 본발명의일 실시예에따른가중치검출을이용한오디오인식장치는수신된오디오신호를분석하여 2차원데이터로변환하는 2차원신호변환부, 변환된 2차원신호에대해서컨벌루션신경망을통해인식네트워크를구성하는신경망구성부, 주요도검출알고리즘을통해가중치를추출하는구간가중치검출부및 인식네트워크및 가중치에기초하여인식결과를판단하는분류처리부를포함한다.

    Abstract translation: 使用重量检测在按照本发明的音频部分识别装置是使用神经网络(神经网络)的音频识别装置,以及分段重量检测算法应用于所述音频输入应用不同的权重,并且识别所述音频信号。 使用根据本发明的一个实施方式的重量检测的音频识别装置,用于通过对一个二维信号转换单元中的卷积神经网络识别的网络中,所转换的二维信号通过分析接收到的音频信号转换成两维数据 以及分类处理单元,用于基于识别网络和权重来确定识别结果。

    제스처 인식 방법 및 장치
    4.
    发明公开
    제스처 인식 방법 및 장치 审中-实审
    识别手法的方法和装置

    公开(公告)号:KR1020160097821A

    公开(公告)日:2016-08-18

    申请号:KR1020150020157

    申请日:2015-02-10

    Inventor: 임우택

    CPC classification number: G06K9/00375 G06F3/04883

    Abstract: 본발명은제스처인식방법및 장치에관한것이다. 본발명에따르면, 오디오신호를출력하는단계; 상기출력된오디오신호가사용자의제스처에의하여변화된오디오신호를획득하는단계; 상기획득한오디오신호를분석하는단계; 및상기오디오신호의분석결과에따라상기사용자의제스처를인식하는단계;를포함하는제스처인식장치가수행하는제스처인식방법이제공된다. 본발명에따르면, 사용자가별도의디바이스를착용하지않고도사용자의제스처를인식하여기기를제어할수 있다.

    Abstract translation: 本发明涉及用于识别手势的方法和装置。 根据本发明,用于识别手势的方法包括以下步骤:输出音频信号; 允许输出音频信号获得由用户的手势改变的音频信号; 分析所获得的音频信号; 并根据音频信号的分析结果识别用户的手势。 根据本发明,用户可以通过识别用户的手势而不穿附加装置来控制装置。

    오디오 신호 및 오디오 신호를 기반으로 한 진동 신호를 생성하는 방법 및 장치
    5.
    发明公开
    오디오 신호 및 오디오 신호를 기반으로 한 진동 신호를 생성하는 방법 및 장치 审中-实审
    用于生成基于音频信号的音频信号和振动信号的方法和装置

    公开(公告)号:KR1020150080740A

    公开(公告)日:2015-07-10

    申请号:KR1020140000181

    申请日:2014-01-02

    Inventor: 임우택

    CPC classification number: G06F3/016 G06F3/16

    Abstract: 오디오신호및 오디오신호를기반으로한 진동신호를생성하는방법및 장치가개시되어있다. 입력오디오신호를기반으로오디오신호및 진동신호를생성하는방법은입력오디오신호의특징정보를추출하는단계, 특징정보를기반으로진동신호및 오디오신호를생성하는단계와진동신호및 오디오신호를동기화하여출력하는단계를포함할수 있다.

    Abstract translation: 公开了一种基于音频信号产生音频信号和振动信号的方法和装置。 基于输入音频信号生成音频信号和振动信号的方法可以包括以下步骤:提取输入音频信号的特征信息; 基于特征信息生成振动信号和音频信号; 以及同步并输出振动信号和音频信号。

    음성/무음성 구간 검출 방법 및 장치
    6.
    发明公开
    음성/무음성 구간 검출 방법 및 장치 审中-实审
    用于检测语音/非语音部分的方法和装置

    公开(公告)号:KR1020150061669A

    公开(公告)日:2015-06-05

    申请号:KR1020130144979

    申请日:2013-11-27

    Inventor: 장인선 임우택

    CPC classification number: G10L25/78

    Abstract: 음성/무음성구간검출방법및 장치를제공한다. 음성/무음성구간검출장치는스테레오오디오신호에서상기스테레오오디오신호의채널간관계정보를획득하는획득부, 상기채널간관계정보를기초로상기스테레오오디오신호의각 요소를센터채널성분과서라운드성분으로분류하는분류부, 상기센터채널성분인요소들로구성된센터채널신호와상기서라운드성분인요소들로구성된서라운드채널신호간의프레임별에너지비율값 및상기스테레오오디오신호를기초로생성된모노신호와상기스테레오오디오신호간의프레임별에너지비율값을계산하는계산부및 상기에너지비율값들을비교하여상기스테레오오디오신호에서음성구간과무음성구간을판단하는판단부를포함할수 있다.

    Abstract translation: 提供了一种检测语音/非语音部分的方法和设备。 用于检测语音/非语音部分的设备包括:获取单元,其获取来自立体声音频信号的立体声音频信号的每个频道之间的关系的信息; 分类单元,其基于所述信道之间的关系信息将所述立体声音频信号的每个元素分类成中心声道分量和环绕声部分; 计算单元,其计算由作为中心声道的分量的元素构成的中心声道信号与作为环绕声道的成分的元素构成的环绕声道信号之间的每帧的能量比值,以及能量比值 在基于立体声音频信号生成的单声道信号和立体声音频信号之间; 以及决定单元,其从立体声音频信号中确定语音部分和非语音部分。

    TTS를 이용한 화면해설방송 제작 방법 및 장치

    公开(公告)号:KR101907957B1

    公开(公告)日:2018-10-16

    申请号:KR1020130070577

    申请日:2013-06-19

    Inventor: 임우택

    Abstract: TTS(Text To Speech)를이용한화면해설방송제작방법및 장치를제공한다. 화면해설방송제작장치는컨텐츠의오디오신호를분석하여상기오디오신호에서묵음구간을검출하는묵음구간검출부, 상기검출된묵음구간중 화면해설이삽입될구간을선택하는화면해설구간선택부및 TTS(Text To Speech)를이용하여상기선택된구간에화면해설을삽입하는화면해설삽입부를포함할수 있다.

    사용자의 머리전달함수 기반 음향 조절 방법 및 장치
    9.
    发明公开
    사용자의 머리전달함수 기반 음향 조절 방법 및 장치 审中-实审
    用于控制用户头部相关传输功能的方法和装置

    公开(公告)号:KR1020150081541A

    公开(公告)日:2015-07-15

    申请号:KR1020140001142

    申请日:2014-01-06

    Inventor: 임우택

    CPC classification number: G06K9/00268 G06F17/30979 H04S2420/01

    Abstract: 본명세서는사용자의머리전달함수기반음향조절방법및 장치에관한것이다. 이러한본 명세서는사용자의얼굴을포함하는영상으로부터사용자의얼굴을검출하는얼굴검출부, 상기영상으로부터상기사용자를촬영한카메라와상기사용자의얼굴사이의거리를추정하고, 상기추정된거리에기반하여상기사용자의두상의특징을계산하는얼굴모델링부, 상기계산된두상의특징을기반으로상기사용자에적합한머리전달함수를데이터베이스로부터검색하는데이터베이스검색부, 상기머리전달함수를기반으로상기사용자에적합한바이노럴(binoral) 음원을합성하는입체음향적용부를포함하는음향조절장치를제공한다.

    Abstract translation: 本发明涉及一种基于用户头部相关传输功能来控制音频的方法和装置。 本发明包括:面部检测单元,从包括用户面的图像检测用户面部; 建模单元,估计用户面和从图像拍摄用户的相机之间的距离,以及基于估计的距离计算用户头部的特征; 数据库搜索单元,基于所计算的特征来搜索适合于用户的头相关传递函数; 以及立体声施加单元,其基于头部相关的传递函数合成适合于用户的双耳声音。

    무선 골 전도 헤드폰
    10.
    发明公开
    무선 골 전도 헤드폰 审中-实审
    无线骨头导电耳机

    公开(公告)号:KR1020140060092A

    公开(公告)日:2014-05-19

    申请号:KR1020120126762

    申请日:2012-11-09

    Inventor: 임우택

    CPC classification number: H04R1/1041 H04R2420/07 H04R2430/01 H04R2460/13

    Abstract: The present invention relates to a wireless headphone transmitting sound through a skull. The present invention includes a housing; a communication unit which is installed in the housing and receives an audio signal from an external audio device; a conversion module converting the audio signal into a vibration signal; a vibration output unit including a plurality of vibration modules vibrated by the vibration signal; and a control unit which is engaged with the vibration output unit and controls the volume of the audio signal based on external noise. The present invention allows a user to listen to stable sounds although the headphone is not touched with skins or the external noise is generated.

    Abstract translation: 无线耳机技术领域本发明涉及通过颅骨传输声音的无线耳机。 本发明包括壳体; 通信单元,其安装在外壳中并从外部音频设备接收音频信号; 将音频信号转换为振动信号的转换模块; 振动输出单元,包括由所述振动信号振动的多个振动模块; 以及控制单元,其与所述振动输出单元接合并且基于外部噪声来控制所述音频信号的音量。 本发明允许用户听到稳定的声音,尽管耳机没有被皮肤触摸或产生外部噪声。

Patent Agency Ranking