-
公开(公告)号:CN1637702A
公开(公告)日:2005-07-13
申请号:CN200410100771.4
申请日:2004-11-30
Applicant: 微软公司
CPC classification number: G06F3/0237 , G06F3/16 , G10L15/1815 , G10L15/22 , G10L2015/228
Abstract: 在向设备输入文本的方法中,提供指示文本条目的第一个字符的第一字符输入。下一步,捕获该文本条目的发声。然后基于该第一字符输入和对该发声的分析,对该发声的第一个单词标识可能候选单词。最后,向用户显示该可能候选单词。
-
公开(公告)号:CN1584984A
公开(公告)日:2005-02-23
申请号:CN200410064217.5
申请日:2004-08-19
Applicant: 微软公司
CPC classification number: G10L21/0208
Abstract: 提供了一种准确地估计噪声并减少模式识别信号中的噪声的系统和方法。该方法和系统将映射随机变量定义为至少干净信号随机变量和噪声随机变量的函数。然后确定描述该映射随机变量的值分布的至少一方面的模型参数。基于该模型参数,确定干净信号随机变量的估计。在本发明的许多方面,映射随机变量是信噪比变量,并且该方法和系统从模型参数估计信噪比变量的值。
-
公开(公告)号:CN1571013A
公开(公告)日:2005-01-26
申请号:CN200410007820.X
申请日:2004-02-13
Applicant: 微软公司
Inventor: M·马哈间 , Y·邓 , A·阿塞罗 , A·J·R·古那瓦达那 , C·切尔巴
CPC classification number: G10L15/197 , G10L15/183
Abstract: 一种建模语音识别系统的方法,包括解码从训练文本产生的语音信号以产生预测语音单元序列。该训练文本包括实际语音单元序列,它与该预测语音单元序列一起使用以形成混淆模型。在进一步的实施例中,该混淆模型用来解码文本,以鉴别如果该语音识别系统根据该文本对语音解码预期将会出现的误差率。
-
公开(公告)号:CN101305360B
公开(公告)日:2013-07-31
申请号:CN200680041464.0
申请日:2006-10-31
Applicant: 微软公司
CPC classification number: G06F17/30778 , G06F17/30746 , G06F17/30749 , G10L15/197
Abstract: 通过获得语音数据的词语的出现概率和词语的位置信息并且将它与文本元数据中该词语的至少位置信息组合来创建用于搜索具有语音数据和文本元数据的口语文档的索引。可以创建单个索引,因为语音数据和文本元数据被同样处理并仅被视为不同的类别。
-
公开(公告)号:CN1645477B
公开(公告)日:2012-01-11
申请号:CN200510005937.9
申请日:2005-01-20
Applicant: 微软公司
CPC classification number: G10L15/065 , G10L15/063 , G10L2015/0631
Abstract: 一种自动语音识别系统识别用户对口述文本的改变,并推断这类改变是否源自用户改变他/她的主意,或者这类改变是否是识别错误的结果。如果检测到识别错误,则系统使用用户纠正的类型来修改其本身,以降低这类识别错误再次出现的机会。因此,该系统和方法提供了具有极少或没有额外用户交互的意义重大的语音识别学习。
-
公开(公告)号:CN101887728B
公开(公告)日:2011-11-23
申请号:CN201010167431.9
申请日:2004-11-26
Applicant: 微软公司
IPC: G10L21/02
CPC classification number: G10L21/0208 , G10L2021/02165
Abstract: 一种方法和系统使用从一不同于气导麦克风的传感器接收的备选传感器信号来估算干净语音值。所述估算或者单独,或者结合气导麦克风信号来使用备选传感器信号。在不使用根据从气导麦克风收集的含噪声的训练数据训练的模型的情况下估算干净语音值。在一个实施例中,向从备选传感器信号形成的矢量添加纠正矢量以形成应用到气导麦克风信号的滤波器,以生成干净语音估算。在其它实施例中,根据备选传感器信号确定语音信号的音调,并将其用于分解气导麦克风信号。分解的信号然后用于确定干净信号估算。
-
公开(公告)号:CN1622200B
公开(公告)日:2010-11-03
申请号:CN200410095649.2
申请日:2004-11-26
Applicant: 微软公司
CPC classification number: G10L21/0208 , G10L2021/02165
Abstract: 一种方法和系统使用从一不同于气导麦克风的传感器接收的备选传感器信号来估算干净语音值。所述估算或者单独,或者结合气导麦克风信号来使用备选传感器信号。在不使用根据从气导麦克风收集的含噪声的训练数据训练的模型的情况下估算干净语音值。在一个实施例中,向从备选传感器信号形成的矢量添加纠正矢量以形成应用到气导麦克风信号的滤波器,以生成干净语音估算。在其它实施例中,根据备选传感器信号确定语音信号的音调,并将其用于分解气导麦克风信号。分解的信号然后用于确定干净信号估算。
-
公开(公告)号:CN1573926B
公开(公告)日:2010-05-26
申请号:CN200410059511.7
申请日:2004-06-03
Applicant: 微软公司
CPC classification number: G06F17/2715 , G06F17/2818 , G10L15/183 , G10L15/197
Abstract: 本发明公开了一种估计语言模型的方法,使得给定字串的类的条件似然最大化,其中该字串与分类精度非常相关。该方法包括对所有类联合的调节统计语言模型参数,使得对于给定的训练句子或发声,分类器区分出正确的类和不正确的类。本发明的特定实施例用于实现用于n-字符列分类器的区别性训练方法的上下文中的有理函数增长变换。
-
公开(公告)号:CN100565671C
公开(公告)日:2009-12-02
申请号:CN200410068599.9
申请日:2004-08-27
Applicant: 微软公司
Abstract: 一种方法和装置通过对每一个别的声道共振频率/带宽计算单独的函数,并将结果相加形成一模拟特征矢量的元素,将一组声道共振频率连同其对应的带宽一起映射到LPC倒频谱形式的模拟声学特征矢量。模拟特征矢量连同输入特征矢量一起应用到一模型,来确定该组声道共振频率出现在语音信号中的概率。在一个实施例中,该模型包括一目标导向转移模型,它基于过去的声道共振频率以及该声道共振频率的目标提供了声道共振频率的概率。在另一实施例中,由HMM系统提供音素分段,并用于精确地确定在每一帧使用哪一目标值。
-
公开(公告)号:CN100336102C
公开(公告)日:2007-09-05
申请号:CN200410032437.X
申请日:2004-03-31
Applicant: 微软公司
CPC classification number: G10L21/0208
Abstract: 一种采用增量贝叶斯学习来估计含噪声的信号中的附加噪声的方法和设备,其中,假定时变噪声先验分布,并采用前一时间步骤上计算所得的后验的近似来递归更新超参量(平均值和方差)。时域中的附加噪声在使用增量贝叶斯学习之前以对数谱或倒谱域来表示。使用每一独立帧的噪声的平均值和方差的估计结果来实现同一对数谱或倒谱域中的语音特性增强。
-
-
-
-
-
-
-
-
-