화자인식시스템의 화자 특징벡터 생성방법 및 시스템
    1.
    发明公开
    화자인식시스템의 화자 특징벡터 생성방법 및 시스템 失效
    用于语音识别系统的同步特征生成的方法和系统

    公开(公告)号:KR1020050048214A

    公开(公告)日:2005-05-24

    申请号:KR1020030082086

    申请日:2003-11-19

    Abstract: 본 발명은 화자인식시스템의 화자 특징벡터 생성방법 및 시스템에 관한 것으로서, 입력된 화자 음성신호에서 특징벡터를 추출하여 화자모델링 훈련 및 화자인식을 수행하는 화자인식시스템에 있어서, 입력된 화자음성신호의 피치간격을 측정하고 소정의 피치구간 음성신호를 추출하는 피치구간 음성추출수단, 피치구간음성추출수단에서 추출된 음성신호의 특징벡터를 생성하는 특징벡터생성수단을 포함하여 이루어진 것을 특징으로 한다.

    추가 비트 할당 기법을 이용한 음성 부호화 및 복호화를위한 송수신기
    2.
    发明授权
    추가 비트 할당 기법을 이용한 음성 부호화 및 복호화를위한 송수신기 失效
    추가비트할당기법을이용한음성부호화및복호화를위한송수신기

    公开(公告)号:KR100467326B1

    公开(公告)日:2005-01-24

    申请号:KR1020020077996

    申请日:2002-12-09

    CPC classification number: G10L19/24 G10L21/038

    Abstract: The present invention relates to a transmitter and a receiver for speech coding and decoding by using an additional bit allocation method. The transmitter and the receiver according to the present invention realize a voice communication service of high quality by using additional bits permitted in system requirements while using a conventional speech coder as it is. In addition, the transmitter and the receiver according to the present invention have an advantage in that they enable insertion of additional quantization blocks while not changing the structure of the conventional standard speech coder, since they allocate additional bits by applying a multi-stage quantization procedure not in a speech signal domain but in a parameter domain.

    Abstract translation: 本发明涉及通过使用附加比特分配方法进行语音编码和解码的发射机和接收机。 根据本发明的发射机和接收机通过使用系统要求中允许的附加比特来实现高质量的语音通信服务,同时使用常规的语音编码器。 另外,根据本发明的发射机和接收机具有这样的优点,即它们能够插入额外的量化块,而不改变常规标准语音编码器的结构,因为它们通过应用多级量化过程来分配附加比特 不在语音信号域中,而是在参数域中。

    서로 다른 CELP 방식의 음성 코덱 간의 상호부호화장치 및 그 방법
    3.
    发明公开
    서로 다른 CELP 방식의 음성 코덱 간의 상호부호화장치 및 그 방법 失效
    装置和方法,用于在具有不同类型的语音编码之间进行数据转换,以降低计算量和提供高质量的语音

    公开(公告)号:KR1020050007854A

    公开(公告)日:2005-01-21

    申请号:KR1020030047455

    申请日:2003-07-11

    CPC classification number: G10L19/173 G10L19/12

    Abstract: PURPOSE: An apparatus and a method for transcoding data between speech codecs having different CELP(Code Excited Linear Prediction) types are provided to reduce quantity of calculation and offer speech with high quality by utilizing one transcoding filter instead of a post-processing filter and a perception weighting filter. CONSTITUTION: A decoding process part(321) converts a bitstream with an input CELP codec format into a speech signal, wherein the bitstream is formed by coding an input speech signal. A transcoding filter(323) filters the decoded speech signal by filter characteristics calculated by adopting an optimal weighting value for minimum spectrum distortion. A transcoding filter design part(322) extracts the optimal weighting value from a weighting value set comprised of a plurality of weighting value pairs. A coding process part(324) codes the speech signal processed by the transcoding filter and thereby generates a bitstream of an output CELP codec format.

    Abstract translation: 目的:提供一种用于在具有不同CELP(代码激励线性预测)类型的语音编解码器之间对数据进行代码转换的装置和方法,以通过利用一个代码转换滤波器而不是后处理滤波器来减少计算量并提供高质量的语音, 感知加权滤波器 构成:解码处理部分(321)将具有输入CELP编解码器格式的比特流转换为语音信号,其中通过对输入的语音信号进行编码来形成比特流。 代码转换滤波器(323)通过针对最小频谱失真采用最佳加权值计算的滤波特性来对解码的语音信号进行滤波。 代码转换滤波器设计部分(322)从由多个加权值对组成的加权值集合中提取最优加权值。 编码处理部分(324)对由代码转换滤波器处理的语音信号进行编码,从而生成输出CELP编解码器格式的比特流。

    광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법
    4.
    发明公开
    광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법 失效
    宽带语音编码器,其方法,宽带解码器及其在语音间隔中提供卓越语音质量的方法,该语音间隔未被编码代码处理

    公开(公告)号:KR1020050006883A

    公开(公告)日:2005-01-17

    申请号:KR1020030046861

    申请日:2003-07-10

    CPC classification number: G10L19/125

    Abstract: PURPOSE: A wideband voice encoder, a method therefor, a wideband decoder and a method therefor are provided to offer excellent voice quality in a voice interval which is not processed by an algebraical codebook by performing multi-stage fixed codebook retrieval. CONSTITUTION: A voice characteristic classifying unit(105) classifies the characteristic of a voice corresponding to a current frame using an open-loop pitch value of a recognition weight filtered signal of a wideband voice signal and a linear prediction factor by a statistical method. An adaptive codebook retrieving unit(106) retrieves a pitch delay value near the open-loop pitch value, calculates a pitch gain value, and generates an adaptive codebook contribution signal. The adaptive codebook retrieving unit outputs difference between the generated adaptive codebook contribution signal and the recognition weight filtered signal as a primary fixed codebook target signal. A primary fixed codebook retrieving unit(107) obtains a primary fixed codebook index and a primary fixed codebook gain value, generates a primary fixed codebook contribution signal corresponding to the obtained primary fixed codebook index. The primary fixed codebook retrieving unit outputs different between the generated primary fixed codebook contribution signal and the primary fixed codebook target signal as a secondary codebook target signal. A secondary fixed codebook retrieving unit(108) has at least two or more fixed codebooks according to voice characteristics, selects one secondary fixed codebook according to voice characteristic information, and retrieves secondary fixed codebook indexes and secondary fixed codebook gain values according to the voice characteristics. A parameter multiplexing unit(110) multiplexes voice characteristic information, the pitch delay value, the pitch gain value, the primary fixed codebook index, the primary fixed codebook gain value, the secondary fixed codebook indexes and the secondary fixed codebook gain values, generates a bit stream, and transmits the bit stream to an external voice decoding terminal.

    Abstract translation: 目的:提供一种宽带语音编码器,其方法,宽带解码器及其方法,以通过执行多级固定码本检索在代码码本不处理的语音间隔中提供优良的语音质量。 构成:语音特征分类单元(105)使用统计方法使用宽带语音信号的识别权重滤波信号和线性预测因子的开环音调值来分类与当前帧相对应的语音的特性。 自适应码本检索单元(106)检索开环音调值附近的音调延迟值,计算音调增益值,并生成自适应码本贡献信号。 自适应码本检索单元输出生成的自适应码本贡献信号和识别权重滤波信号之间的差作为主要固定码本目标信号。 主固定码本检索单元(107)获得主固定码本索引和主固定码本增益值,生成与所获得的主固定码本索引相对应的主固定码本贡献信号。 主固定码本检索单元在所生成的主固定码本贡献信号和主固定码本目标信号之间输出不同的第二码本目标信号。 第二固定码本检索单元(108)根据语音特征具有至少两个或多个固定码本,根据语音特征信息选择一个辅助固定码本,并根据语音特征检索辅助固定码本索引和辅助固定码本增益值 。 参数复用单元(110)多路复用语音特征信息,音调延迟值,音调增益值,主固定码本索引,主固定码本增益值,辅助固定码本索引和辅助固定码本增益值,生成 并将比特流发送到外部语音解码终端。

    광대역 음성신호의 송수신 장치 및 그 송수신 방법
    5.
    发明公开
    광대역 음성신호의 송수신 장치 및 그 송수신 방법 失效
    发送/接收宽带语音信号的装置和方法

    公开(公告)号:KR1020040055073A

    公开(公告)日:2004-06-26

    申请号:KR1020020081663

    申请日:2002-12-20

    CPC classification number: H04L12/66

    Abstract: PURPOSE: An apparatus and a method for transmitting/receiving a wideband voice signal are provided to offer high sound quality 16 kHz sampled wideband voice signal and compatibility with an existing system. CONSTITUTION: A analyzing/filtering unit(301) receives a digital voice signal and outputs a low band voice signal having a bandwidth of 0-4 kHz of 8 kHz sampling period. A low band standard coding unit(302) receives the low band voice signal, codes it and outputs a coded low band standard signal. A low band additional coding unit(304) receives a difference between a filtered low band voice signal and a composite signal that has been decoded by a low band standard decoding unit(303) and codes them to generate a low band additional signal. An enhancement residual band coding unit(306) up-samples a composite signal obtained by combining signals outputted from the low band standard decoding unit(303) and the low band additional decoding unit(305), obtains a difference between the up-sampled signal and a voice signal inputted to the analyzing/filtering unit(301), and generates an enhancement residual band signal.

    Abstract translation: 目的:提供用于发送/接收宽带语音信号的装置和方法,以提供高音质16kHz采样宽带语音信号和与现有系统的兼容性。 构成:分析/滤波单元(301)接收数字语音信号并输出​​具有8kHz采样周期的0-4kHz带宽的低频语音信号。 低频标准编码单元(302)接收低频语音信号,对其编码并输出编码的低频带标准信号。 低频带附加编码单元(304)接收滤波后的低频语音信号和由低频带标准解码单元(303)解码的复合信号之间的差,并对它们进行编码以产生低频带附加信号。 增强残差频带编码单元(306)对通过组合从低频带标准解码单元(303)和低频带附加解码单元(305)输出的信号获得的复合信号进行上采样,获得上采样信号 以及输入到分析/滤波单元(301)的语音信号,并产生增强剩余频带信号。

    가변 프레임 음성 부호화/복호화 장치 및 그 방법
    6.
    发明授权
    가변 프레임 음성 부호화/복호화 장치 및 그 방법 失效
    可变帧语音编码/解码的装置和方法

    公开(公告)号:KR100651731B1

    公开(公告)日:2006-12-01

    申请号:KR1020040097916

    申请日:2004-11-26

    Abstract: 본 발명은 입력 음성 신호의 특성에 따라 입력 음성 신호의 등급을 분류하고 분류한 등급에 대응하는 프레임 크기, 양자화기 구조 및 비트 할당 구조를 사용하여 부호화를 수행하거나, 네트워크의 상태 또는 통화 상대방이 사용하는 음성 부호화기의 종류에 따라 프레임 크기를 조정할 수 있는 음성 부호화/복호화 장치 및 그 방법에 관한 것이다. 본 발명은 입력 음성의 특성에 따라 프레임의 크기와 양자화기 구조 및 비트 할당을 최적으로 조정하여 음성 부호화 장치의 성능을 향상 시킬 수 있으며, 통화 상대방이 사용하는 음성 부호화기의 종류에 따라 프레임의 크기를 조정함으로써 전체 통화 지연을 줄일 수 있다.

    화자인식시스템의 화자 특징벡터 생성방법 및 시스템
    7.
    发明授权
    화자인식시스템의 화자 특징벡터 생성방법 및 시스템 失效
    扬声器识别系统的Pith同步特征生成方法与系统

    公开(公告)号:KR100526110B1

    公开(公告)日:2005-11-08

    申请号:KR1020030082086

    申请日:2003-11-19

    Abstract: 본 발명은 화자인식시스템의 화자 특징벡터 생성방법 및 시스템에 관한 것으로서, 입력된 화자 음성신호에서 특징벡터를 추출하여 화자모델링 훈련 및 화자인식을 수행하는 화자인식시스템에 있어서, 입력된 화자음성신호의 피치간격을 측정하고 소정의 피치구간 음성신호를 추출하는 피치구간 음성추출수단, 피치구간음성추출수단에서 추출된 음성신호의 특징벡터를 생성하는 특징벡터생성수단을 포함하여 이루어진 것을 특징으로 한다.

    광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법
    8.
    发明授权
    광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법 失效
    宽带语音编码器及其方法,以及宽带语音解码器及其方法

    公开(公告)号:KR100651712B1

    公开(公告)日:2006-11-30

    申请号:KR1020030046861

    申请日:2003-07-10

    CPC classification number: G10L19/125

    Abstract: 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기 및 그 방법이 개시된다. 본 발명에 따른 광대역 음성 부호화기는 부호화할 광대역 음성신호의 개회로 피치값과 선형예측계수를 이용하여 현재 프레임에 해당하는 음성의 특성을 규정하는 음성 특성 분류부, 적응 코드북을 검색하여 적응 코드북 피치 지연값 및 적응 코드북 피치 이득값을 얻고, 1차 고정 코드북 목적신호를 생성하는 적응 코드북 검색부, 1차 고정 코드북을 검색하여 1차 고정 코드북 인덱스와 1차 고정 코드북 이득값을 얻고, 2차 고정 코드북 목적신호를 생성하는 1차 고정 코드북 검색부, 음성 특성에 따라 적어도 둘 이상의 2차 고정 코드북들을 구비하며, 음성 특성 정보에 따라 하나의 2차 고정 코드북을 선택 및 검색하여 2차 고정 코드북 인덱스들과 2차 고정 코드북 이득값들 검색하는 2차 고정코드북 검색부 및 각 부에서 얻어지는 파라미터들을 양자화 및 다중화하여 비트열로 만들어 외부의 음성 복호화단으로 전송하는 파라미터 다중화부를 포함하는 것을 특징으로 하며, 음성 특성에 따라 2개 이상으로 구성된 2차 고정 코드북들로부터 음성 특성에 적합한 2차 고정 코드북을 선택함으로써 광대역 음성신호에 대해 보다 우수한 음질을 제공할 수 있다.

    폴-제로 디워핑을 이용한 크로스톡 제거방법 및 크로스톡제거필터
    9.
    发明授权
    폴-제로 디워핑을 이용한 크로스톡 제거방법 및 크로스톡제거필터 失效
    使用极零抽油的串扰消除方法及其装置

    公开(公告)号:KR100596175B1

    公开(公告)日:2006-07-06

    申请号:KR1020040071312

    申请日:2004-09-07

    Abstract: 본 발명은 스테레오로 레코딩된 원 음장을 두 개의 스피커를 이용하여 양쪽 귀 주변에서 완벽히 재생하기 위한 크로스톡(crosstalk) 제거 방법 및 제거필터에 관한 것이며, 특히 저주파 대역에서의 성능을 개선하기 위한 주파수-워핑기술에 관한 것으로서, pole-zero 디워핑(dewarping)을 통하여 적은 연산량으로 종래의 기술과 유사한 성능을 제공한다.
    크로스톡 제거기, minimum phase, 주파수-워핑, least squares, pole-zero modeling, pole-zero 디워핑)

    보완적 특징벡터를 이용한 화자특징벡터 생성방법 및 장치
    10.
    发明授权
    보완적 특징벡터를 이용한 화자특징벡터 생성방법 및 장치 失效
    使用补充特征的特征向量生成的方法和装置

    公开(公告)号:KR100563316B1

    公开(公告)日:2006-03-27

    申请号:KR1020040043158

    申请日:2004-06-11

    Abstract: 본 발명의 목적을 달성하기 위한 보완적 특징벡터를 이용한 화자특징벡터 생성방법 및 장치에 관한 것으로서, 본 발명의 목적은 입력된 화자 음성신호에서 특징벡터를 추출하여 화자모델링 훈련 및 화자인식을 수행하는 화자인식시스템에 있어서, 상기 입력된 음성신호에 목적화자와 사칭화자에 따라 서로 다른 제한된 환경의 보완적 특징을 첨가하는 보완특징첨가수단과, 상기 보완특징첨가수단을 통해 보완적 특징이 첨가된 음성신호의 특징벡터를 추출하는 특징벡터생성수단을 포함하여 구성된 것을 특징으로 한다.
    화자, 목적화자, 사칭화자, 음성, 인식, 특징, 벡터, 추출, 생성, 보완, 제한적 환경

Patent Agency Ranking