-
公开(公告)号:CN1674092B
公开(公告)日:2010-06-09
申请号:CN200410033216.4
申请日:2004-03-26
Applicant: 松下电器产业株式会社
Abstract: 一种用于汉语连续数字识别的声学建模方法,包括步骤:a)为汉语连续数字的不同的声、韵母单独建立模型;b)定义汉语连续数字的上下文相关性,建立上下文相关的声学模型,以准确刻画连续数字语音;c)以隐马尔可夫(HMM)模型为基本模型表示,利用状态聚类算法对连续数字的隐马尔可夫模型的参数进行训练,得到连续数字声学模型。另外,本发明还公开了汉语连续数字的声母、韵母跨词搜索解码方法,以及声学建模系统和搜索解码系统。
-
公开(公告)号:CN1655232A
公开(公告)日:2005-08-17
申请号:CN200410004131.3
申请日:2004-02-13
Applicant: 松下电器产业株式会社
IPC: G10L15/00
Abstract: 一种上下文相关的汉语语音识别建模方法,基于汉语的语言特点,采用声母右相关和韵母左相关的建模方法,包括步骤:(a)将汉语语音的声母与紧邻其右侧的韵母相关,而韵母与紧邻其左侧的声母相关,创建上下文相关的基本建模单元;(b)利用状态聚类法对模型的参数进行训练,以得到初始隐马尔可夫模型(HMM);(c)利用子空间聚类算法对初始隐马尔可夫模型进行压缩,以产生最终模型。
-
公开(公告)号:CN102473409A
公开(公告)日:2012-05-23
申请号:CN201180002465.5
申请日:2011-04-19
Applicant: 松下电器产业株式会社
IPC: G10L11/00
CPC classification number: G10L25/57 , G10L2015/0631
Abstract: 本发明提供一种在利用AV流中的音频流来执行AV流的分类等的装置中,对执行该分类时所使用的声音空间基准模型进行在线自适应调节的装置以及其方法。该装置将所输入的音频流分割成具有相同声音特征的片段数据,并对所分割得到的片段数据的单一概率模型进行估计。其后,针对所估计的单一概率模型与到此为止所存储的其他的声音特征的单一概率模型执行聚类,来生成新的声音空间的基准模型。
-
公开(公告)号:CN1755795B
公开(公告)日:2010-12-15
申请号:CN200410083149.7
申请日:2004-09-30
Applicant: 松下电器产业株式会社
Abstract: 公开了一种构造汉语数字音库的方法及汉语数字串合成系统和方法,用于解决现有的音库无法适应嵌入式设备的小内存和数字串合成所需的高自然度问题。该方法包括:产生一包括多个数字单元串的原始音库,所述数字单元串是相应汉语数字串的发音的表示;从原始音库中挑选其中的数字单元分别位于所述汉语数字串的串首、串中和串尾的二元组数字单元;从原始音库中挑选其中的数字单元分别位于所述汉语数字串的串首、串中和串尾的一元组数字单元;裁减相邻数字单元之间的影响程度弱的二元组数字单元;由裁减后的二元组数字单元和挑选的一元组数字单元构成目标音库。采用上述方法,保持了高自然度的合成语音的同时,音库的规模足够小,可以被移植到具有小内存的嵌入式设备中。
-
公开(公告)号:CN1841500B
公开(公告)日:2010-04-14
申请号:CN200510062908.6
申请日:2005-03-30
Applicant: 松下电器产业株式会社
Abstract: 本发明揭示一种基于自适应非线性谱减的语音识别抗噪方法,包括步骤:基于平均梅尔频带信噪比进行语音检测,当平均信噪比大于预定的信噪比阈值时则判断为语音信息,否则判断为噪音信息;根据在语音检测步骤中得到的噪音帧更新当前的噪音估计,进行第一次谱减计算,获得具有高信噪比的含噪语音;对具有高信噪比的含噪语音进行第二次谱减计算以进一步消除含噪语音信号中的噪声。
-
公开(公告)号:CN102473409B
公开(公告)日:2014-04-23
申请号:CN201180002465.5
申请日:2011-04-19
Applicant: 松下电器产业株式会社
IPC: G10L25/57
CPC classification number: G10L25/57 , G10L2015/0631
Abstract: 本发明提供一种在利用AV流中的音频流来执行AV流的分类等的装置中,对执行该分类时所使用的声音空间基准模型进行在线自适应调节的装置以及其方法。该装置将所输入的音频流分割成具有相同声音特征的片段数据,并对所分割得到的片段数据的单一概率模型进行估计。其后,针对所估计的单一概率模型与到此为止所存储的其他的声音特征的单一概率模型执行聚类,来生成新的声音空间的基准模型。
-
公开(公告)号:CN102237084A
公开(公告)日:2011-11-09
申请号:CN201010155674.0
申请日:2010-04-22
Applicant: 松下电器产业株式会社
CPC classification number: G10L25/57 , G10L2015/0631
Abstract: 公开了一种在AV设备中用输入的AV流中包含的音频流对声音空间的基准模型进行在线自适应调节的方法和装置及设备。该方法包括步骤:估计音频流中每个声音事件的单一概率模型,所述声音事件具有单一的声学特征;针对事先存储的至少一个单一概率模型和各个声音事件的单一概率模型进行聚类,以更新所述声音空间的基准模型。利用上述方案,可以根据随时输入的AV流来自适应在线调节声音空间的基准模型,从而避免了聚类过程中的遗漏。即使对于较长AV流中的一小段声音事件,也能够实现正确的聚类。
-
公开(公告)号:CN1841500A
公开(公告)日:2006-10-04
申请号:CN200510062908.6
申请日:2005-03-30
Applicant: 松下电器产业株式会社
Abstract: 本发明揭示一种基于自适应非线性谱减的语音识别抗噪方法,包括步骤:基于平均梅尔频带信噪比进行语音检测,当平均信噪比大于预定的信噪比阈值时则判断为语音信息,否则判断为噪音信息;根据在语音检测步骤中得到的噪音帧更新当前的噪音估计,进行第一次谱减计算,获得具有高信噪比的含噪语音;对具有高信噪比的含噪语音进行第二次谱减计算以进一步消除含噪语音信号中的噪声。
-
公开(公告)号:CN1755795A
公开(公告)日:2006-04-05
申请号:CN200410083149.7
申请日:2004-09-30
Applicant: 松下电器产业株式会社
Abstract: 公开了一种构造汉语数字音库的方法,用于解决现有的音库无法适应嵌入式设备的小内存和数字串合成所需的高自然度问题。该方法包括:产生一包括多个数字单元串的原始音库,所述数字单元串是相应汉语数字串的发音的表示;从原始音库中挑选其中的数字单元分别位于所述汉语数字串的串首、串中和串尾的二元组数字单元;从原始音库中挑选其中的数字单元分别位于所述汉语数字串的串首、串中和串尾的一元组数字单元;裁减相邻数字单元之间的影响程度弱的二元组数字单元;由裁减后的二元组数字单元和挑选的一元组数字单元构成目标音库。采用上述方法,保持了高自然度的合成语音的同时,音库的规模足够小,可以被移植到具有小内存的嵌入式设备中。
-
公开(公告)号:CN1655232B
公开(公告)日:2010-04-21
申请号:CN200410004131.3
申请日:2004-02-13
Applicant: 松下电器产业株式会社
IPC: G10L15/00
Abstract: 一种上下文相关的汉语语音识别建模方法,基于汉语的语言特点,采用声母右相关和韵母左相关的建模方法,包括步骤:(a)将汉语语音的声母与紧邻其右侧的韵母相关,而韵母与紧邻其左侧的声母相关,创建上下文相关的基本建模单元;(b)利用状态聚类法对模型的参数进行训练,以得到初始隐马尔可夫模型(HMM);(c)利用子空间聚类算法对初始隐马尔可夫模型进行压缩,以产生最终模型。
-
-
-
-
-
-
-
-
-