语音合成设备、语音合成方法和程序

    公开(公告)号:CN1813285A

    公开(公告)日:2006-08-02

    申请号:CN200480018265.9

    申请日:2004-06-03

    Inventor: 佐藤宁

    CPC classification number: G10L13/027

    Abstract: 一种简单构成的语音合成设备等,用于以高速度产生自然的合成语音。当提供了表示消息模板的数据时,话音元编辑器(5)搜索话音元数据库(7),搜索关于声音与消息模板中的话音元匹配的话音元的话音元数据。而且,话音元编辑器(5)预测消息模板的韵律,并且根据韵律预测的结果,以一次一个的方式从已检索出的话音元数据中选择消息模板中的每个话音元的最佳匹配。对于不能选择出其匹配的话音元,指令声处理器(41)提供表示每个单位话音的波形的波形数据。组合所选择的的话音元数据和由声处理器(41)提供的波形数据,以生成表示合成语音的数据。

    语音信号内插的装置、方法和程序

    公开(公告)号:CN1514931A

    公开(公告)日:2004-07-21

    申请号:CN03800344.9

    申请日:2003-05-28

    Inventor: 佐藤宁

    CPC classification number: G10L21/0364 G10L19/09 G10L19/097 G10L25/18

    Abstract: 本发明提供了一种语音信号内插装置,其能从语音压缩状态恢复自然人声并保持高的音质。当表征将被内插的语音的语音信号由语音数据输入单元1获得时,基音获得单元2对这个语音信号进行滤波以从滤波结果确定音长。音长固定单元3使语音信号具有对应单位基音的段的恒定时长,并产生基音波形数据。子带分割单元4转换基音波形数据为表征频谱的子带数据。多个子带数据被平均单元5进行平均,然后,子带合成单元6转换子带数据为表征子带合成单元6的语音波形的信号。每段的时长由基音恢复单元7恢复,并且声音输出单元8重放信号表示的声音。

    生成基音周期波形信号的装置和方法及处理语音信号的装置和方法

    公开(公告)号:CN1473322A

    公开(公告)日:2004-02-04

    申请号:CN02802813.9

    申请日:2002-08-30

    Inventor: 佐藤宁

    CPC classification number: G10L13/08 G10L19/09 G10L21/003 G10L21/013 G10L21/04

    Abstract: 提供了一种基音周期波形信号生成方法,作为用于有效地对具有波动的基音周期的语音波形信号进行编码的基本处理。且进一步提供使用该方法的语音信号压缩/扩展装置以及语音信号合成装置,和与之相关的信号处理。本发明的基音周期波形生成方法主要包括:检测语音波形信号的每一个基音周期波形成分的瞬时基音周期的方法,和通过根据每一个检测到的瞬时基音周期在时间轴上扩展和压缩基音周期波形成分、同时保留它的波形模式来将相应的基音周期波形成分处理成具有预定固定的时间长度的归一化基音周期波形成分的过程。通过使用本发明的基音周期波形信号生成方法来对语音波形信号进行编码或合成,可以高质量和高效地压缩具有基音周期波动的语音信号。

    设备控制装置、以及设备控制方法

    公开(公告)号:CN1890710B

    公开(公告)日:2010-04-28

    申请号:CN200480036114.6

    申请日:2004-12-06

    Inventor: 佐藤宁

    CPC classification number: G10L15/26

    Abstract: 语言分析部(2)对语音输入部(1)输入的语音进行语音识别,确定具有表示该语音的可能性的单词和其分数,将表示这些单词和分数的数据供给到代理处理部(6)。代理处理部(6)存储获取单词数据等的数据获取处理、判断处理、定义输入输出处理的处理项目数据,定义从一个处理向下一个处理的转移并对该转移赋予的转移常数的数据、即线路,作为整体执行表示的处理项目数据和线路的流程,从而控制属于输入输出对象设备群(5)的设备。向流程内的哪一个处理转移由处理进行位置和线路的连接关系决定的各条线路的权重系数以及单词数据的分数决定。

    语音信号压缩设备、语音信号压缩方法和程序

    公开(公告)号:CN100570709C

    公开(公告)日:2009-12-16

    申请号:CN200480008663.2

    申请日:2004-03-26

    Inventor: 佐藤宁

    CPC classification number: G10L21/0208 G10L25/90

    Abstract: 本发明提供了一种用于去除必然混杂在语音中的噪声的语音信号噪声去除设备和具有类似功能的设备。间距分析部分(2)决定语音间距成分各频率的修正后的移动平均值,该语音是由语音输入部分(1)获得的原始语音信号所表示的。可变滤波器(3)通过从原始语音信号成分中去除由间距分析部分(2)所确定的修正后的移动平均值及其附近之外的成分,以提取该间距成分。绝对值检测部分(4)确定该间距成分的绝对值,并且低通滤波器(5)对表示所获得的绝对值的信号进行滤波以生成增益调整信号。随后,通过由增益调整信号的值所确定的增益,由增益调整部分(7)对由延迟部分(6)调整了时点的原始语音数据进行放大或减弱并输出。

    基音波形信号发生设备、基音波形信号发生方法及程序

    公开(公告)号:CN1473325A

    公开(公告)日:2004-02-04

    申请号:CN02802825.2

    申请日:2002-08-30

    Inventor: 佐藤宁

    CPC classification number: G10L19/09 G10L19/097 G10L19/265

    Abstract: 计算机对语音数据进行滤波,并根据滤波结果过零的时刻确定基音长度。只要从语音数据的对数倒频谱提取的基音长度与周期图的偏差不超过预定量,就将滤波的通带的中央频率控制为与根据过零时间确定的基音长度的倒数相等的值。接下来,计算机根据滤波结果,将语音数据分割为片断的单元基音,并将各片断的相位和采样数设为常数,以消除基音波动的影响。然后,通过多种方法对获得的基音波形数据进行内插,且将其中谐波成分较少的数据与表示每一片断的原始采样数目及幅度的数据一起输出。

    语音合成装置及语音合成方法

    公开(公告)号:CN101171624B

    公开(公告)日:2011-08-10

    申请号:CN200680015605.1

    申请日:2006-03-10

    Inventor: 佐藤宁

    CPC classification number: G10L13/06 G10L13/08

    Abstract: 语音片段编辑部分(5)从语音片段数据库(7)中检索关于语音片段的语音片段数据,其中该语音片段的读音与固定消息中语音片段的读音相匹配,并对该语音片段进行转换,以便于与由该发声速度数据指定的速度相匹配。该语音片段编辑部分(5)预测固定消息的韵律,并根据该韵律预测结果逐个地选择与该固定消息的每个语音片段最匹配的检索到的语音片段数据的项。但是,如果对应于该语音片段数据的被选择的项的部分语音片段没有达到预定值,则取消该选择。关于没有被选择的语音片段,将表示每个单位语音波形的波形数据提供给声音处理部分(41)。将该选择的语音片段数据与提供的波形数据互连,从而生成表示合成语音的数据。这样,就提供了一种语音合成装置,用于迅速地产生合成语音,而这种简单结构不会带来任何不舒服的感觉。

    生成基音周期波形信号的装置和方法及处理语音信号的装置和方法

    公开(公告)号:CN1324556C

    公开(公告)日:2007-07-04

    申请号:CN02802813.9

    申请日:2002-08-30

    Inventor: 佐藤宁

    CPC classification number: G10L13/08 G10L19/09 G10L21/003 G10L21/013 G10L21/04

    Abstract: 提供了一种基音周期波形信号生成方法,作为用于有效地对具有波动的基音周期的语音波形信号进行编码的基本处理。且进一步提供使用该方法的语音信号压缩/扩展装置以及语音信号合成装置,和与之相关的信号处理。本发明的基音周期波形生成方法主要包括:检测语音波形信号的每一个基音周期波形成分的瞬时基音周期的方法,和通过根据每一个检测到的瞬时基音周期在时间轴上扩展和压缩基音周期波形成分、同时保留它的波形模式来将相应的基音周期波形成分处理成具有预定固定的时间长度的归一化基音周期波形成分的过程。通过使用本发明的基音周期波形信号生成方法来对语音波形信号进行编码或合成,可以高质量和高效地压缩具有基音周期波动的语音信号。

    设备控制装置、语音识别装置、代理装置、数据结构以及设备控制方法

    公开(公告)号:CN1890710A

    公开(公告)日:2007-01-03

    申请号:CN200480036114.6

    申请日:2004-12-06

    Inventor: 佐藤宁

    CPC classification number: G10L15/26

    Abstract: 语言分析部(2)对语音输入部(1)输入的语音进行语音识别,确定具有表示该语音的可能性的单词和其分数,将表示这些单词和分数的数据供给到代理处理部(6)。代理处理部(6)存储获取单词数据等的数据获取处理、判断处理、定义输入输出处理的处理项目数据,定义从一个处理向下一个处理的转移并对该转移赋予的转移常数的数据、即线路,作为整体执行表示的处理项目数据和线路的流程,从而控制属于输入输出对象设备群(5)的设备。向流程内的哪一个处理转移由处理进行位置和线路的连接关系决定的各条线路的权重系数以及单词数据的分数决定。

    生成基音周期波形信号的装置和方法及处理语音信号的装置和方法

    公开(公告)号:CN1702736A

    公开(公告)日:2005-11-30

    申请号:CN200510074068.5

    申请日:2002-08-30

    Inventor: 佐藤宁

    CPC classification number: G10L19/09 G10L19/097 G10L19/265

    Abstract: 提供了一种基音周期波形信号生成方法,作为用于有效地对具有波动的基音周期的语音波形信号进行编码的基本处理。且进一步提供使用该方法的语音信号压缩/扩展装置以及语音信号合成装置,和与之相关的信号处理。本发明的基音周期波形生成方法主要包括:检测语音波形信号的每一个基音周期波形成分的瞬时基音周期的方法,和通过根据每一个检测到的瞬时基音周期在时间轴上扩展和压缩基音周期波形成分、同时保留它的波形模式来将相应的基音周期波形成分处理成具有预定固定的时间长度的归一化基音周期波形成分的过程。通过使用本发明的基音周期波形信号生成方法来对语音波形信号进行编码或合成,可以高质量和高效地压缩具有基音周期波动的语音信号。

Patent Agency Ranking