-
公开(公告)号:CN113899577B
公开(公告)日:2024-07-26
申请号:CN202111206117.1
申请日:2018-08-24
Applicant: 日本电信电话株式会社
Abstract: 本发明提供异常声音探测装置、异常声音生成装置、异常数据生成装置、异常模型学习装置、异常声音生成方法以及记录介质,该异常声音探测装置包括:模型存储单元,存储将预先准备的异常声音数据建模后的概率分布即第1异常模型和将与所述异常声音数据不同的异常声音即追加异常声音建模后的概率分布即第2异常模型;异常度获取单元,对于输入的对象声音数据,组合所述第1异常模型和所述第2异常模型来计算异常度;以及状态判定单元,将所述异常度与规定的阈值比较,判定所述对象声音数据是正常声音还是异常声音。
-
公开(公告)号:CN108962270B
公开(公告)日:2023-03-17
申请号:CN201811010320.X
申请日:2013-05-22
Applicant: 日本电信电话株式会社
IPC: G10L19/09 , G10L25/90 , G10L19/00 , G10L19/02 , G10L19/032
Abstract: 本发明的解码方法包括:长期预测信息解码步骤,对时域基音周期码进行解码而获得时域的基音周期L;周期换算步骤,获得与MDCT系数串即频域样本串中的、上述时域的基音周期L对应的频域的样本间隔作为换算间隔T1,对第一频域基音周期码进行解码而获得表示第一频域基音周期T是上述换算间隔T1的几倍的倍数值,获得对上述换算间隔T1乘以上述倍数值所得的值作为上述第一频域基音周期T;以及频域基音周期考虑解码步骤,以基于上述第一频域基音周期T的解码方法,将码串解码,得到上述频域样本串。
-
公开(公告)号:CN109147827B
公开(公告)日:2023-02-17
申请号:CN201811009738.9
申请日:2013-05-22
Applicant: 日本电信电话株式会社
Abstract: 本发明的编码方法包括:周期换算步骤,时域的基音周期L与预定的时间区间的音响信号的时域基音周期码对应,且获得与上述时域的基音周期L对应的频域的样本间隔作为换算间隔T1;频域基音周期分析步骤,从包括上述换算间隔T1以及上述换算间隔T1的整数倍的值U×T1的候选值中决定源于上述音响信号的频域样本串的基音周期、即第一频域基音周期T,获得表示上述第一频域基音周期T是上述换算间隔T1的几倍的第一频域基音周期码,其中,U是预先决定的第一范围的整数;以及频域基音周期考虑编码步骤,将上述频域样本串以基于上述第一频域基音周期T的编码方法进行编码。
-
公开(公告)号:CN110070877B
公开(公告)日:2022-11-11
申请号:CN201811547976.5
申请日:2014-07-16
Applicant: 日本电信电话株式会社
Abstract: 自相关计算部(21)根据输入信号而计算自相关RO(i)。预测系数计算部(23)使用系数wO(i)和自相关RO(i)相乘得到的变形自相关R'O(i)而进行线性预测分析。在此,假设对于至少一部分的各阶数i,包含以下情况,即与各阶数i对应的系数wO(i),具有随着与当前或者过去的帧中的输入信号的基本频率处于负的相关关系的值的增加而单调增加的关系。
-
公开(公告)号:CN110491402B
公开(公告)日:2022-10-21
申请号:CN201910728067.X
申请日:2015-02-20
Applicant: 日本电信电话株式会社
Abstract: 提供能够提高音频信号的基音周期引起的波峰的附近的近似精度的包络序列以及周期性综合包络序列生成装置、方法、程序、记录介质。本发明的周期性综合包络序列生成装置,将预定的时间区间即帧单位的时域的音频数字信号作为输入音频信号,作为包络序列而生成周期性综合包络序列。本发明的周期性综合包络序列生成装置至少包括频谱包络序列计算部和周期性综合包络生成部。频谱包络序列计算部基于输入音频信号的时域的线性预测,计算输入音频信号的频谱包络序列。周期性综合包络生成部基于输入音频信号在频域中的周期性分量,对频谱包络序列进行变形,并设为周期性综合包络序列。
-
公开(公告)号:CN113921021A
公开(公告)日:2022-01-11
申请号:CN202111170288.3
申请日:2016-01-27
Applicant: 日本电信电话株式会社 , 国立大学法人东京大学
IPC: G10L19/02 , G10L19/035 , G10L19/06 , G10L19/12 , G10L19/22
Abstract: 根据编码装置,在频域中对每预定时间区间的时序信号进行编码,其中,将参数η设为正数,将与时序信号对应的参数η作为对白化频谱序列的直方图进行近似的广义高斯分布的形状参数,按每预定时间区间能够选择多个参数η中的任一个或者参数η可变,上述白化频谱序列是将频域样本串除以通过将与该时序信号对应的频域样本串的绝对值的η次方当作功率谱而估计出的频谱包络所得的序列,所述编码装置包括:编码部,通过至少基于每预定时间区间的参数η而确定的结构的编码处理,对每预定时间区间的时序信号进行编码。
-
公开(公告)号:CN107945813B
公开(公告)日:2021-10-26
申请号:CN201810027226.9
申请日:2013-08-28
Applicant: 日本电信电话株式会社
Abstract: 其目的在于,提供在基于以CELP类的方式为首的声音的生成模型的声音编码方式中,即使输入信号为噪声重叠声音也能够实现自然的再现音的解码方法。包含:声音解码步骤,从所输入的码得到解码声音信号;噪声生成步骤,生成作为随机的信号的噪声信号;以及噪声附加步骤,将噪声附加处理后信号设为输出信号,其中,所述噪声附加处理后信号是将对噪声信号进行基于与过去的帧的解码声音信号对应的功率和与当前的帧的解码声音信号对应的谱包络中的至少其中一个的信号处理而得到的信号、以及解码声音信号进行相加而得到的。
-
公开(公告)号:CN107851442B
公开(公告)日:2021-07-20
申请号:CN201680019872.X
申请日:2016-04-11
Applicant: 日本电信电话株式会社 , 国立大学法人东京大学
Abstract: 匹配装置包括:匹配单元(51),基于与构成第一信号的至少1个规定的时长的时序信号分别对应的参数η的第一序列和与构成第二信号的至少1个规定的时长的时序信号分别对应的参数η的第二序列,判定第一信号和第二信号的一致程度、和/或第一信号和第二信号是否一致。
-
公开(公告)号:CN112992164A
公开(公告)日:2021-06-18
申请号:CN202110195328.3
申请日:2015-05-15
Applicant: 日本电信电话株式会社
Abstract: 目的在于提供一种编码技术,与输入音响信号的特性无关地高效地进行编码,且能够得到收听者感到不自然的情况较少的解码音响信号。一种编码方法,将输入音响信号按规定时间区间的帧的每个,通过在频域上的多个编码处理之中被决定的编码处理来进行编码,其中,决定部(380)在前一帧的输入音响信号的高频分量的能量的大小与当前帧的输入音响信号的高频分量的能量的大小的至少其中一个为规定的阈值以下的情况下,设为能够将与前一帧不同的编码处理决定作为当前帧的编码处理。
-
公开(公告)号:CN106663437B
公开(公告)日:2021-02-02
申请号:CN201580022887.7
申请日:2015-02-20
Applicant: 日本电信电话株式会社
Abstract: 提供一种能够将在由音响信号的基音周期引起的峰值附近的近似精度高的频域的包络序列以较少的码量再现的编码装置、解码装置。本发明的编码装置具有周期性综合包络生成部以及可变长度编码部。周期性综合包络生成部生成基于与从输入音响信号而求得的线性预测系数码对应的频域的序列即谱包络序列、以及频域的周期的、频域的序列即周期性综合包络序列。可变长度编码部,对源于输入音响信号的频域的序列进行编码。本发明的解码装置具有周期性综合包络生成部和可变长度解码部。周期性综合包络生成部生成频域的序列的周期性综合包络序列,所述周期性综合包络序列基于与线性预测系数码对应的频域的序列即谱包络序列、以及频域的周期。可变长度解码部对可变长度码进行解码而获得频域的序列。
-
-
-
-
-
-
-
-
-