유성음 구간에서 프레임별 피치 검출 방법

    公开(公告)号:KR1019980037190A

    公开(公告)日:1998-08-05

    申请号:KR1019960055906

    申请日:1996-11-21

    Inventor: 강동규 한민수

    Abstract: 본 발명은 음성 신호 처리 방법에 관한 것으로, 약 500㎐로 저역 통과된 유성음 신호에서 인접한 영교차점 구간별 면적을 산출하고 인접한 면적의 합을 구하여 피치를 검출하기 용이한 진폭 변화를 피크를 산출한다. 그리고 분석 프레임 내에서 대표적인 진폭 변화 피크의 수에 따라 분석 프레임의 길이를 재설정한 후 임의의 두 진폭 변화 피크의 크기에 대한 유사도를 두 피크의 거리에 대한 분포로 나타내고 최대 분포 봉우리의 중심 거리를 측정하여 분석 구간 내에서의 피치 및 후보 피치를 검출한다. 또한 전체 음성 신호의 피치 윤곽선에서 프레임별 피치 변화치를 참조로 예상 검출에러 구간에 대해 후보 피치를 이용하여 에러를 수행한다. 이렇게 함으로서 보다 정확한 피치를 검출할 수 있고 광범위한 피치의 분포와 변화에 적응이 용이할 뿐 아니라 고속 처리가 가능한 유성음 구간에서 프레임별 피치 검출 방법이 제시된다.

    음성합성을 이용한 정보통신 서비스 검색 장치 및 방법
    32.
    发明授权
    음성합성을 이용한 정보통신 서비스 검색 장치 및 방법 失效
    使用声学合成的信息电信服务

    公开(公告)号:KR100128844B1

    公开(公告)日:1998-04-15

    申请号:KR1019940034757

    申请日:1994-12-16

    Abstract: Disclosed is an apparatus and method to search an information-communication service using a voice synthesis. The apparatus comprises a member processor(1), a voice synthesizer(3), a service connector(4) and a central processor(2). The member processor(1) matches the members having a general electronic telephone. The voice synthesizer(3) synthesizes voices and sends the result signal to the member processor(1). The service connector(4) connects to the information-communication service network. The central processor(2) controls each component. Thereby, the members having a general electronic telephone are able to access the information-communication service.

    Abstract translation: 公开了一种使用语音合成来搜索信息通信服务的装置和方法。 该装置包括成员处理器(1),语音合成器(3),服务连接器(4)和中央处理器(2)。 会员处理器(1)与具有通用电子电话的成员相匹配。 语音合成器(3)合成语音,并将结果信号发送给会员处理器(1)。 服务连接器(4)连接到信息通信服务网络。 中央处理器(2)控制每个组件。 因此,具有一般电子电话的成员能够访问信息通信服务。

    전화번호안내용 음성데이타 제작방법

    公开(公告)号:KR1019970056663A

    公开(公告)日:1997-07-31

    申请号:KR1019950055859

    申请日:1995-12-23

    Abstract: 본 발명은 114 안내음성의 자연성 개선 방법에 관한 것으로서, 114 안내 시스템에 있어서, 중복되는 음성 단위를 추출하는 제1단계; 상기 제1단계후 유사음운 환경을 이용하여 그룹화 하는 제2단계; 상기 제2단계후 음운환경이 경음화된 음성 단위를 생성하는 제3단계; 및 상기 제3단계후 114 안내 문장을 이루는 기타 음성 단위를 생성되는 제4단계를 구비하여 종래 114 안내음성의 대표적 부자연스런 부분(네 : [숫자음]+[국에],[숫자음]+[번입니다])을 개선하고 중복되는 음성단위(예 : 천, 백, 십, 국에, 번)를 따로 저장하여 메모리 사용량을 줄일 수 있는 효과가 있다.

    다이폰 단위를 이용한 엘에스피(LSP)방식의 음성 합성 방법
    34.
    发明公开
    다이폰 단위를 이용한 엘에스피(LSP)방식의 음성 합성 방법 失效
    采用Diphone单元的LSP方法的语音合成方法

    公开(公告)号:KR1019960024888A

    公开(公告)日:1996-07-20

    申请号:KR1019940036104

    申请日:1994-12-22

    Abstract: 본 발명은 한국어 문자를 음성으로 합성하는 방법에 대한 것으로서, 음성을 다이폰 단위로 세분하여 합성 데이타베이스로부터 파라미터를 가져와서 LSP합성방식으로 음성으로 변환하는 방법이다. 본 발명에 사용한 특징으로는 다이폰 단위로의분류와 결합을 효율적으로 세분화하였으며 합성 데이타베이스를 구성하는 경우 각각의 다이폰에 대해서 특수한 경계표시를 하였다. 각각의 경계표시는 다이폰의 유형에 따라서 서로 다른 의미를 가지며 합성단위들을 결합하는 경우 길이의 조절과 결합이 용이하도록 구성하였다. 또한 음성합성기술의 관건은 합성음의 품질이므로 LSP 합성필터의 음원으로 수정된LF 모델과 리지쥬얼(residual)신호를 사용하여 자연성과 명료성을 높이고자 하였다.
    본 발명은 현재 늘어가는 정보 통신 서비스와 연결될 경우 합성기술을 이용한 정보검색의 급증으로 새로운 정보제공 기술의 증진을 가져오는 효과를 가진다.

    포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
    36.
    发明授权
    포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치 有权
    用于编码和解码支持下载信号的多对象音频的设备

    公开(公告)号:KR101614160B1

    公开(公告)日:2016-04-20

    申请号:KR1020090061736

    申请日:2009-07-07

    CPC classification number: G10L19/20 G10L19/008

    Abstract: 포스트다운믹스신호를지원하는다객체오디오부호화장치및 복호화장치가개시된다. 다객체오디오부호화장치는입력객체신호로부터다운믹스신호와객체정보를추출하는추출부, 상기추출된다운믹스신호와상기포스트다운믹스신호를이용하여다운믹스정보파라미터를결정하는파라미터결정부및 상기다운믹스정보파라미터와상기객체정보를조합하여객체비트스트림을생성하는비트스트림생성부를포함할수 있다.

    Abstract translation: 可以提供支持后降混信号的多对象音频编码和解码装置。 多对象音频编码装置可以包括:对象信息提取和下混合生成单元,用于从输入对象信号生成对象信息和后同步信号; 参数确定单元,用于使用所提取的下混合信号和后下混合信号来确定下混信息参数; 以及比特流生成单元,用于组合对象信息和下混信息参数,并生成对象比特流。

    공간정보 기반의 다객체 오디오 부호화에서의 오디오 객체 편집 방법 및 그 장치
    38.
    发明公开
    공간정보 기반의 다객체 오디오 부호화에서의 오디오 객체 편집 방법 및 그 장치 有权
    用于基于多个对象音频编码的空间信息编辑音频对象的方法和装置

    公开(公告)号:KR1020100007740A

    公开(公告)日:2010-01-22

    申请号:KR1020090061636

    申请日:2009-07-07

    CPC classification number: G11B27/034 G10L19/008

    Abstract: PURPOSE: A method and a device for editing an audio object in a multi-object audio code based on space information are provided to omit a coding process about the edited object using the multi-object bit stream and a down mix signal generated through the coding of the input objects. CONSTITUTION: An object information extractor(210) receives an object bit stream. The object information extractor extracts the object information from the object bit stream. A down mix processor(220) receives the down mix signal. The down mix processor controls the down mix signal using the object edition information and the object information. A bit stream processor(230) edits the object information according to the object edition information. The bit stream processor generates the object bit stream controlled based on the edited object information.

    Abstract translation: 目的:提供一种用于基于空间信息编辑多对象音频代码中的音频对象的方法和装置,以使用多对象比特流和通过编码产生的下混合信号来省略关于编辑对象的编码处理 的输入对象。 构成:对象信息提取器(210)接收对象比特流。 对象信息提取器从对象比特流中提取对象信息。 下混合处理器(220)接收下混合信号。 下混合处理器使用对象版本信息和对象信息来控制下混合信号。 比特流处理器(230)根据对象版本信息编辑对象信息。 比特流处理器基于编辑的对象信息生成受控的对象比特流。

    공간정보기반 오디오 부호화에서의 공간정보 추출 방법
    39.
    发明授权
    공간정보기반 오디오 부호화에서의 공간정보 추출 방법 有权
    在空间音频编码中获得空间线索的方法

    公开(公告)号:KR100740807B1

    公开(公告)日:2007-07-19

    申请号:KR1020040117805

    申请日:2004-12-31

    Abstract: 본 발명은 공간정보기반 오디오 부호화(SAC: Spatial Audio Coding) 방식을 이용한 멀티채널 오디오 신호의 부호화 및 복호화하는 과정에서 부가정보로 사용되는 공간정보 (spatial cue)를 추출 및 적용하는 방법에 관한 것이다. 본 발명의 일특징에 따르면, 멀티채널 오디오 신호의 공간정보 오디오 부호화시에 각 서브밴드별 공간 정보를 추출하는 방법이 제공된다. 상기 공간정보 추출 방법은, 좌우 비대칭적이고 동일한 최대치를 지니며 이웃한 창함수와 중첩되는 부분에서 그 합이 일정 상수로 표현되도록 서브밴드별 창함수를 선정하는 단계와, 상기 선정된 창함수를 이용하여 공간정보를 추출하는 단계를 포함하는 것을 특징으로 한다. 일실시예에서, 상기 공간 정보는 채널간 에너지비(Inter-Channel Level Difference: ICLD)이다.
    공간정보 기반 오디오 부호화(spatial audio coding:SAC), ICLD(Inter Channel Level Difference)

    공간정보기반 오디오 부호화를 위한 채널간 에너지비 추정및 양자화 방법
    40.
    发明公开
    공간정보기반 오디오 부호화를 위한 채널간 에너지비 추정및 양자화 방법 失效
    用于空间音频编码的信道间信道估计和量化方法

    公开(公告)号:KR1020060079119A

    公开(公告)日:2006-07-05

    申请号:KR1020050134637

    申请日:2005-12-30

    Abstract: 본 발명은 멀티채널 오디오 신호 또는 복수개의 독립된 오디오 신호를 모노 또는 스테레오로 다운믹스된 신호와 공간 정보(spatial cues)로 표현 및 전송시에 공간정보의 추정 및 양자화를 수행하는 방법에 관한 것이다. ICLD를 추정하는데 있어서 각 서브밴드에 대하여 최대 평균에너지를 갖는 채널을 기준채널로 이용하여 ICLD를 추정하는 방법과, 각 부가정보를 전송하기 이전에 양자화를 수행하는 방법에 있어서 비대칭 비선형 양자화(asymmetric nonuniform quantization)를 수행하는 방법을 제안한다.
    공간정보기반 오디오 코딩(Spatial Audio Coding:SAC), 바이노럴 큐 코딩(Binaural Cue Coding: BCC), 채널간 에너지 비(Inter Channel Level Difference:ICLD), 채널간 시간 지연 비(Inter Channel Time Difference:ICTD), 양자화(quantization)

Patent Agency Ranking