-
公开(公告)号:CN102568484A
公开(公告)日:2012-07-11
申请号:CN201110415397.7
申请日:2011-12-02
Applicant: 微软公司
CPC classification number: G10L15/02 , G10L15/30 , G10L19/02 , G10L19/0212
Abstract: 本发明涉及弯曲谱和精细估计音频编码。原始音频信号的弯曲谱估计可用于对该原始信号的精细估计的表示进行编码。可将弯曲谱估计的表示和精细估计的表示发送至语音识别系统。可将弯曲谱估计的表示传递至语音识别引擎,在其中它可用于语音识别。弯曲谱估计的表示可与精细估计的表示一起使用以重构原始音频信号的表示。
-
-
公开(公告)号:CN1538382A
公开(公告)日:2004-10-20
申请号:CN200410033100.0
申请日:2004-03-12
Applicant: 微软公司
CPC classification number: G10L15/144 , G10L15/285
Abstract: 一种压缩具有对角协方差矩阵的多维高斯分布的方法,该方法包括对各维数群集重复群集中的多个高斯分布。各群集可以用一个具有一个平均值和一个方差的质心来表示。最小化一个训练数据集的似然的整个减少量以便表示多个高斯分布。
-
公开(公告)号:CN102592591B
公开(公告)日:2015-07-15
申请号:CN201110435771.X
申请日:2011-12-22
Applicant: 微软公司
CPC classification number: G10L19/005 , G10L15/02 , G10L19/20 , G10L21/038 , G10L2019/0001
Abstract: 本文描述用于双带语音编码的各种技术。在一些实施例中,从远程实体接收第一类型的语音特征,基于该第一类型的语音特征确定第二类型的语音特征的估计,第二类型的语音特征的估计被提供给语音识别器,从语音识别器接收基于第二类型的语音特征的估计的语音识别结果,并且语音识别结果被传送至远程实体。
-
公开(公告)号:CN102568484B
公开(公告)日:2014-08-13
申请号:CN201110415397.7
申请日:2011-12-02
Applicant: 微软公司
CPC classification number: G10L15/02 , G10L15/30 , G10L19/02 , G10L19/0212
Abstract: 本发明涉及弯曲谱和精细估计音频编码。原始音频信号的弯曲谱估计可用于对该原始信号的精细估计的表示进行编码。可将弯曲谱估计的表示和精细估计的表示发送至语音识别系统。可将弯曲谱估计的表示传递至语音识别引擎,在其中它可用于语音识别。弯曲谱估计的表示可与精细估计的表示一起使用以重构原始音频信号的表示。
-
公开(公告)号:CN101305362B
公开(公告)日:2012-04-18
申请号:CN200680041634.5
申请日:2006-10-31
Applicant: 微软公司
CPC classification number: G06F17/30778 , G06F17/30746 , G10L15/197
Abstract: 通过标识语音段的至少两个替换词语序列来索引该语音段。对于该替换序列中的每个词语,信息被置于该索引中该词语的条目中。基于该词语出现在该语音段中的概率与阈值的比较来从该索引中的条目删去语音单元。
-
-
公开(公告)号:CN102592591A
公开(公告)日:2012-07-18
申请号:CN201110435771.X
申请日:2011-12-22
Applicant: 微软公司
CPC classification number: G10L19/005 , G10L15/02 , G10L19/20 , G10L21/038 , G10L2019/0001
Abstract: 本文描述用于双带语音编码的各种技术。在一些实施例中,从远程实体接收第一类型的语音特征,基于该第一类型的语音特征确定第二类型的语音特征的估计,第二类型的语音特征的估计被提供给语音识别器,从语音识别器接收基于第二类型的语音特征的估计的语音识别结果,并且语音识别结果被传送至远程实体。
-
公开(公告)号:CN1584984B
公开(公告)日:2010-05-26
申请号:CN200410064217.5
申请日:2004-08-19
Applicant: 微软公司
CPC classification number: G10L21/0208
Abstract: 提供了一种准确地估计噪声并减少模式识别信号中的噪声的系统和方法。该方法和系统将映射随机变量定义为至少干净信号随机变量和噪声随机变量的函数。然后确定描述该映射随机变量的值分布的至少一方面的模型参数。基于该模型参数,确定干净信号随机变量的估计。在本发明的许多方面,映射随机变量是信噪比变量,并且该方法和系统从模型参数估计信噪比变量的值。
-
公开(公告)号:CN100589179C
公开(公告)日:2010-02-10
申请号:CN200410007820.X
申请日:2004-02-13
Applicant: 微软公司
Inventor: M·马哈间 , Y·邓 , A·阿塞罗 , A·J·R·古那瓦达那 , C·切尔巴
CPC classification number: G10L15/197 , G10L15/183
Abstract: 一种建模语音识别系统的方法,包括解码从训练文本产生的语音信号以产生预测语音单元序列。该训练文本包括实际语音单元序列,它与该预测语音单元序列一起使用以形成混淆模型。在进一步的实施例中,该混淆模型用来解码文本,以鉴别如果该语音识别系统根据该文本对语音解码预期将会出现的误差率。
-
-
-
-
-
-
-
-
-