感情识别装置
    11.
    发明公开

    公开(公告)号:CN101346758A

    公开(公告)日:2009-01-14

    申请号:CN200780000900.4

    申请日:2007-05-21

    CPC classification number: G10L17/26 G10L2015/025

    Abstract: 提供一种感情识别装置,与音韵信息的个人差别、地方差别、依据语言的差别无关,可以准确且稳定地进行依据声音的感情识别,所述感情识别装置依据输入声音来识别该输入声音的讲话者的感情,包括:特征性音色检测单元,从所述输入声音中检测与特定的感情有关的特征性音色;声音识别单元(106),识别输入声音中包含的音韵的种类;特征性音色检测单元(104),从所述输入声音中检测与特定的感情有关的特征性音色;特征性音色发生指标计算单元(111),根据所述声音识别单元(106)所识别的音韵的种类,按每个音韵计算特征性音色发生指标,该特征性音色发生指标示出所述特征性音色的发生容易度;以及感情判断单元(113),根据所述特征性音色发生指标计算单元(111)所计算的所述特征性音色发生指标来判断在发生了所述特征性音色的音韵中的所述输入声音的讲话者的感情。

    说话人标准化方法及用该方法的语音识别装置

    公开(公告)号:CN1312656C

    公开(公告)日:2007-04-25

    申请号:CN03160348.3

    申请日:2003-09-24

    CPC classification number: G10L17/12

    Abstract: 将输入语音切分为一定时间长度作为帧,抽取每帧的音响特征量,利用预先规定的多个频率变换系数将所述音响特征量进行频率变换。利用通过频率变换得到的多个变换后特征量及至少1个标准音韵模型的全部组合,计算每帧的变换后特征量与标准音韵模型的多个类似度或距离,利用该多个类似度或距离,决定使输入语音标准化用的频率变换条件,利用决定的频率变换条件使输入语音标准化。根据该方法,即使发出语音的说话人调换,也能够补偿输入语音的个人差别,提高语音识别性能。

    声源方向检测装置
    13.
    发明授权

    公开(公告)号:CN101617245B

    公开(公告)日:2012-10-10

    申请号:CN200880004059.0

    申请日:2008-09-10

    CPC classification number: G01S3/8083

    Abstract: 包括FFT分析部(103(1)~103(3)),对于设置在互相隔开的位置上的两个以上的麦克风所收集的每一个声信号,生成该声信号的至少1个频带的频谱;检测音确定部(104(1)~104(3)),根据所述频带的频谱,确定求出声源方向的检测音的频谱的时刻部分;以及方向检测部(105),根据检测声源方向的时间单位即时间区间中的所述检测音确定部(104(1)~104(3))确定的时刻部分的频谱在所述麦克风之间的一致程度,求出所述检测音到达所述麦克风的时间差,根据所述时间差、所述麦克风间的距离和音速来求出声源方向并输出。

    声源位置检测装置
    14.
    发明授权

    公开(公告)号:CN101512374B

    公开(公告)日:2012-04-11

    申请号:CN200780032157.0

    申请日:2007-11-06

    Abstract: 本发明提供一种可以检测抽取声的声源位置的声源位置检测装置,其具有:至少两个麦克风;对含有分别输入到两个麦克风的噪声的混合声进行频率分析,输出频率信号的分析部(103);以及抽取部(105),其生成多个包含在混合声中的抽取声的声源候补位置,按照声源候补位置对对应于两个麦克风的频率信号的时间轴进行调整以使从该声源候补位置到两个麦克风的混合声的时间差为零,求出表示时间轴调整后的对应于两个麦克风的频率信号中两个麦克风间的频率信号的差异程度的差分距离在阈值以下的频率信号,根据所求出的频率信号中对应于两个麦克风的频率信号彼此的一致程度,从声源候补位置中抽取抽取声的声源位置。

    声音判断装置、声音检测装置以及声音判断方法

    公开(公告)号:CN101601088A

    公开(公告)日:2009-12-09

    申请号:CN200880004020.9

    申请日:2008-08-25

    CPC classification number: G10L21/0208 G10L2025/783 G10L2025/937

    Abstract: 噪声除去装置(100)包括:FFT分析部(2402),接受包含抽出音和噪声的混合音,并针对规定的时间宽度中所包含的多个时刻的每一个来求所述混合音的频率信号;以及抽出音判断部(101(j)),针对所述规定的时间宽度中所包含的多个时刻的所述频率信号,将由第一阈值以上的数量构成的、且频率信号之间的相位距离在第二阈值以下的频率信号的每一个,判断为所述抽出音的频率信号;所述相位距离是,在将时刻t的频率信号的相位设为ψ(t)时,以ψ′(t)=mod2π(ψ(t)-2πft)来表示相位时的频率信号的相位间距离,相位的单位为弧度,f为分析频率。

    声源位置检测装置
    16.
    发明公开

    公开(公告)号:CN101512374A

    公开(公告)日:2009-08-19

    申请号:CN200780032157.0

    申请日:2007-11-06

    Abstract: 本发明提供一种可以检测抽取声的声源位置的声源位置检测装置,其具有:至少两个麦克风;对含有分别输入到两个麦克风的噪声的混合声进行频率分析,输出频率信号的分析部(103);以及抽取部(105),其生成多个包含在混合声中的抽取声的声源候补位置,按照声源候补位置对对应于两个麦克风的频率信号的时间轴进行调整以使从该声源候补位置到两个麦克风的混合声的时间差为零,求出表示时间轴调整后的对应于两个麦克风的频率信号中两个麦克风间的频率信号的差异程度的差分距离在阈值以下的频率信号,根据所求出的频率信号中对应于两个麦克风的频率信号彼此的一致程度,从声源候补位置中抽取抽取声的声源位置。

    语音识别装置及语音识别方法

    公开(公告)号:CN100495535C

    公开(公告)日:2009-06-03

    申请号:CN200480000433.1

    申请日:2004-02-04

    Abstract: 本发明的语音识别装置(1)包括:无用信息声音模型保存部(110),预先保存从无用词的集合学习到的声音模型——无用信息声音模型;特征量计算部(101),对每个声音分析的单位——帧的包含非语言声音的未知输入语音进行声音分析,计算识别所需的特征参数;无用信息声音得分计算部(111),对每个帧对照特征参数和无用信息声音模型,计算无用信息声音得分;无用信息声音得分校正部(113),对输入了非语言声音的帧进行校正以提高无用信息声音得分计算部(111)算出的无用信息声音得分;以及识别结果输出部(105),将语言得分、单词声音得分、以及无用信息声音得分校正机构校正过的无用信息声音得分的累计得分最高的单词串作为未知输入语音的识别结果来输出。

    对象声音分析装置、对象声音分析方法及对象声音分析程序

    公开(公告)号:CN101213589A

    公开(公告)日:2008-07-02

    申请号:CN200680023615.X

    申请日:2006-12-21

    CPC classification number: G10L25/48 G08G1/017 G10L21/028 G10L25/90

    Abstract: 一种对象声音分析装置,对具有与对象声音相同的基本周期且不同于对象声音的声音和对象声音进行区分,能够分析包含在评价声音中的对象声音,该对象声音分析装置分析在评价声音(S100)中是否包含对象声音(S101),具备:对象声音准备部(102),准备为了分析基本周期而使用的分析波形、即对象声音(S101);评价声音准备部(102),准备被分析基本周期的被分析波形、即评价声音(S100);分析部(104),将上述对象声音(S101)相对于上述评价声音(S100)进行时移的同时,依次计算对应的时刻的上述评价声音(S100)和上述对象声音(S101)的差分值,计算该差分值成为预定阈值(S104)以下的时刻的重复间隔,基于该重复间隔的周期和上述对象声音(S101)的基本周期,判断在上述评价声音(S100)中是否存在上述对象声音(S101)。

    说话人标准化方法及用该方法的语音识别装置

    公开(公告)号:CN1494053A

    公开(公告)日:2004-05-05

    申请号:CN03160348.3

    申请日:2003-09-24

    CPC classification number: G10L17/12

    Abstract: 将输入语音切分为一定时间长度作为帧,抽取每帧的音响特征量,利用预先规定的多个频率变换系数将所述音响特征量进行频率变换。利用通过频率变换得到的多个变换后特征量及至少1个标准音韵模型的全部组合,计算每帧的变换后特征量与标准音韵模型的多个类似度或距离,利用该多个类似度或距离,决定使输入语音标准化用的频率变换条件,利用决定的频率变换条件使输入语音标准化。根据该方法,即使发出语音的说话人调换,也能够补偿输入语音的个人差别,提高语音识别性能。

    音频信号编码方法、解码方法,及音频信号编码装置、解码装置

    公开(公告)号:CN1222997A

    公开(公告)日:1999-07-14

    申请号:CN97195785.1

    申请日:1997-07-01

    CPC classification number: G10L19/038 G10L2019/0005

    Abstract: 为了使用矢量量化方法把音频信号进行编码,减少信息量,在编码单元1中进行编码时,选择把输入矢量进行分割生成的子矢量与发送侧代码薄29003中的各音频代码之间的听觉距离中具有最小距离的音频代码,对于与听觉重要度高的子矢量的要素相当的部分,在音频代码选择单元2900102中忽略表示其相位信息的正负符号进行处理,相对于发送侧代码薄29003中的音频代码进行比较检索,在所得到的结果上另外添加由相位信息抽取单元2900107抽取的与上述子矢量的要素部分对应的相位信息作为代码索引进行输出,由此能够不降低解码时音频信号的听觉品质,减少矢量量化的代码检索中的计算量,减少代码薄的代码数。

Patent Agency Ranking