KR20210035042A - Emotional speech synthesis method and apparatus for controlling the emotion between emotions

    公开(公告)号:KR20210035042A

    公开(公告)日:2021-03-31

    申请号:KR1020200109402A

    申请日:2020-08-28

    CPC classification number: G10L13/08 G10L25/63

    Abstract: 감정 간의 강도 조절이 가능한 감정 음성 생성 방법 및 장치이 개시된다. 감정 음성 생성 방법은 동일한 감정을 표현하는 가중치 벡터들을 그룹화하여 감정 군집들을 생성하는 단계; 동일한 감정 군집에 포함된 가중치 벡터들 간의 거리인 내부 거리를 결정하는 단계; 서로 다른 감정 군집에 포함된 가중치 벡터들 간의 거리인 외부 거리를 결정하는 단계; 상기 내부 거리 및 상기 외부 거리에 기초하여 상기 감정 군집들 각각의 대표 가중치 벡터를 결정하는 단계; 감정을 표현하기 위한 운율의 정보가 포함된 스타일 토큰에 상기 감정 군집의 대표 가중치 벡터를 적용하여 스타일 임베딩을 생성하는 단계; 및 상기 스타일 임베딩을 이용하여 감정을 나타내는 감정 음성을 생성하는 단계를 포함할 수 있다.

    천이구간 부호화 왜곡에 강인한 오디오 부호화/복호화 장치 및 방법

    公开(公告)号:WO2022010189A1

    公开(公告)日:2022-01-13

    申请号:PCT/KR2021/008417

    申请日:2021-07-02

    Abstract: 천이구간 부호화 왜곡에 강인한 오디오 부호화/복호화 장치 및 방법이 개시된다. 오디오 부호화 방법은 입력 신호를 T/F(time-to-frequency) 변환하여 주파수 영역 신호를 출력하는 단계; 상기 주파수 영역 신호에 FDNS(frequency domain noise shaping) 부호화를 적용하여 상기 주파수 영역 신호에서 주파수축 포락선이 제거된 주파수 영역 잔차 신호를 출력하는 단계; 상기 주파수 영역 잔차 신호를 기초로 LPC(linear prediction coefficient) 분석을 수행하여 시간축 포락선이 제거된 시간 영역 잔차 신호를 출력하는 단계; 및 상기 시간 영역 잔차 신호를 양자화하여 전송하는 단계를 포함할 수 있다.

    프리셋을 이용한 객체기반 오디오 시스템, 객체기반 오디오 제공 방법 및 객체기반 오디오 재생 방법
    3.
    发明申请
    프리셋을 이용한 객체기반 오디오 시스템, 객체기반 오디오 제공 방법 및 객체기반 오디오 재생 방법 审中-公开
    基于对象的音频系统,基于对象的音频提供方法和使用预置功能的基于对象的音频播放方法

    公开(公告)号:WO2010147442A1

    公开(公告)日:2010-12-23

    申请号:PCT/KR2010/003993

    申请日:2010-06-21

    CPC classification number: G11B27/105

    Abstract: 프리셋을 이용한 객체기반 오디오 시스템, 객체기반 오디오 제공 방법 및 객체기반 오디오 재생 방법이 개시된다. 객체기반 오디오 시스템은 객체기반 오디오 파일의 저장 위치를 참조하는 참조 정보를 제공하는 참조 정보 제공부 및 객체기반 오디오 파일을 구성하는 적어도 하나의 오디오 객체를 제어하기 위한 프리셋 정보를 제공하는 프리셋 정보 제공부를 포함한다.

    Abstract translation: 公开了一种基于对象的音频系统,基于对象的音频提供方法和使用预设功能的基于对象的音频播放方法。 基于对象的音频系统包括:参考信息提供器,其提供用于参考基于对象的音频文件的存储位置的参考信息; 以及提供用于控制构成基于对象的音频文件的至少一个音频对象的预设信息的预设信息提供器。

    음성/무음성 구간 검출 방법 및 장치
    4.
    发明授权
    음성/무음성 구간 검출 방법 및 장치 有权
    用于检测语音/非语音部分的方法和装置

    公开(公告)号:KR101808810B1

    公开(公告)日:2017-12-14

    申请号:KR1020130144979

    申请日:2013-11-27

    Inventor: 장인선 임우택

    CPC classification number: G10L25/78

    Abstract: 음성/무음성구간검출방법및 장치를제공한다. 음성/무음성구간검출장치는스테레오오디오신호에서상기스테레오오디오신호의채널간관계정보를획득하는획득부, 상기채널간관계정보를기초로상기스테레오오디오신호의각 요소를센터채널성분과서라운드성분으로분류하는분류부, 상기센터채널성분인요소들로구성된센터채널신호와상기서라운드성분인요소들로구성된서라운드채널신호간의프레임별에너지비율값 및상기스테레오오디오신호를기초로생성된모노신호와상기스테레오오디오신호간의프레임별에너지비율값을계산하는계산부및 상기에너지비율값들을비교하여상기스테레오오디오신호에서음성구간과무음성구간을판단하는판단부를포함할수 있다.

    Abstract translation: 提供了一种用于检测语音/非语音部分的方法和设备。 语音/非语音区间检测装置,所述获取单元,基于用于从立体声音频信号获取对每个元素到一个立体声音频信号的中心信道分量和环绕部件的立体声音频信号的信道之间的关系的信息的信道之间的关系的信息, 类别分类部,在该中心信道信号和环绕信道信号的一帧一帧的能量比的环绕组件的元件的中心通道组件被配置作为一个元素值和立体声音频信号的单声道信号,并生成所述立体声基于由 计算单元,用于计算音频信号之间的每帧能量的比率;以及确定单元,用于比较能量比值以确定立体声音频信号中的语音区间和非语音区间。

    오디오 신호 변환 장치 및 방법
    7.
    发明授权
    오디오 신호 변환 장치 및 방법 有权
    转换音频信号的装置和方法

    公开(公告)号:KR101206177B1

    公开(公告)日:2012-11-28

    申请号:KR1020090027319

    申请日:2009-03-31

    Abstract: 오디오 신호 변환 장치 및 방법이 개시된다. 오디오 신호 변환 장치는 복수의 서브 신호를 포함하는 오디오 신호로부터 적어도 하나의 서브 신호를 추출하는 신호 추출부, 상기 추출된 적어도 하나의 서브 신호와 대응되는 상기 오디오 신호의 재생 공간에서의 가상 위치를 변경하는 제어부, 및 상기 가상 위치가 변경된 적어도 하나의 서브 신호 및 상기 복수의 서브 신호 중에서 추출되지 않은 서브 신호를 렌더링하는 렌더링부를 포함한다.
    오디오 신호 변환, 음원 신호, 채널 신호, 가상 위치, 깊이감

    게임 장치에서의 오디오 제공 시스템
    8.
    发明公开
    게임 장치에서의 오디오 제공 시스템 有权
    用于在游戏设备中提供三维音频信号的系统

    公开(公告)号:KR1020110070395A

    公开(公告)日:2011-06-24

    申请号:KR1020090127202

    申请日:2009-12-18

    Abstract: PURPOSE: A system for providing a three dimensional audio signal in a game apparatus is provided to offer a realistic audio signal in a stereo environment through audio signal processing. CONSTITUTION: A system for providing a three dimensional audio signal in a game apparatus comprises: a memory unit(310) storing a audio signal; a signal processing unit(320) which extracts an audio signal that output is requested from the memory unit and processes the extracted audio signal corresponding to the output position information; and an audio output device(330) outputting the processed audio signal through an audio signal generating module equipped in the game apparatus.

    Abstract translation: 目的:提供一种用于在游戏装置中提供三维音频信号的系统,以通过音频信号处理在立体声环境中提供逼真的音频信号。 构成:用于在游戏装置中提供三维音频信号的系统包括:存储单元(310),存储音频信号; 信号处理单元(320),从存储器单元提取输出的音频信号,并处理与输出位置信息对应的提取的音频信号; 以及通过装配在游戏装置中的音频信号产生模块输出经处理的音频信号的音频输出装置(330)。

    프리셋을 이용한 객체기반 오디오 시스템, 객체기반 오디오 제공 방법 및 객체기반 오디오 재생 방법
    10.
    发明公开
    프리셋을 이용한 객체기반 오디오 시스템, 객체기반 오디오 제공 방법 및 객체기반 오디오 재생 방법 有权
    基于对象的音频系统,基于对象的音频提供方法和基于对象的音频播放系统

    公开(公告)号:KR1020100136916A

    公开(公告)日:2010-12-29

    申请号:KR1020100054490

    申请日:2010-06-09

    CPC classification number: G11B27/3027 H04L29/06027 H04N21/23412

    Abstract: PURPOSE: An object-based audio system, an object-based audio providing method and an object-based audio play system using preset are provided to control the audio objects constituting an object based audio file by providing preset information for controlling the audio object. CONSTITUTION: A reference information provider(310) provides the reference information for controlling an audio object constituting an object based audio file. The object based audio file is provided based on the reference information. The object based audio file is reproduced based on the preset information, and the preset information and the reference information are provided by being stored a preset file of an object-based box structure.

    Abstract translation: 目的:提供基于对象的音频系统,基于对象的音频提供方法和使用预设的基于对象的音频播放系统,通过提供用于控制音频对象的预设信息来控制构成基于对象的音频文件的音频对象。 构成:参考信息提供者(310)提供用于控制构成基于对象的音频文件的音频对象的参考信息。 基于对象的音频文件是基于参考信息提供的。 基于对象的音频文件基于预设信息被再现,并且通过存储基于对象的盒结构的预设文件来提供预设信息和参考信息。

Patent Agency Ranking