-
公开(公告)号:CN100580771C
公开(公告)日:2010-01-13
申请号:CN200410033100.0
申请日:2004-03-12
Applicant: 微软公司
CPC classification number: G10L15/144 , G10L15/285
Abstract: 一种压缩具有对角协方差矩阵的多维高斯分布的方法,该方法包括对各维数群集重复群集中的多个高斯分布。各群集可以用一个具有一个平均值和一个方差的质心来表示。最小化一个训练数据集的似然的整个减少量以便表示多个高斯分布。
-
公开(公告)号:CN101305360A
公开(公告)日:2008-11-12
申请号:CN200680041464.0
申请日:2006-10-31
Applicant: 微软公司
CPC classification number: G06F17/30778 , G06F17/30746 , G06F17/30749 , G10L15/197
Abstract: 通过获得语音数据的词语的出现概率和词语的位置信息并且将它与文本元数据中该词语的至少位置信息组合来创建用于搜索具有语音数据和文本元数据的口语文档的索引。可以创建单个索引,因为语音数据和文本元数据被同样处理并仅被视为不同的类别。
-
公开(公告)号:CN1653520A
公开(公告)日:2005-08-10
申请号:CN03811403.8
申请日:2003-05-20
Applicant: 微软公司
CPC classification number: G10L15/20 , G10L21/0208
Abstract: 提供了一种基于语音失真的参数模型确定降噪中的不确定性的方法和装置。该方法首先用于降低含噪声的信号中的噪声。具体地,通过使用一声学环境模型(413)从含噪声的信号的一部分的表示中降低(304)噪声以产生净化信号的表示。然后计算与所述降噪过程相关联的不确定性。在一个实施例中,使用降噪过程的不确定性以及经降噪的信号对模式状态进行解码。
-
公开(公告)号:CN1624765A
公开(公告)日:2005-06-08
申请号:CN200410095656.2
申请日:2004-11-26
Applicant: 微软公司
Abstract: 一种方法和装置跟踪语音信号中的共振分量,包括频率和带宽。通过定义对过去的声道共振矢量线性、且预测当前声道共振矢量的状态方程式来跟踪这些分量。也定义对当前声道共振矢量为线性的、且预测观测矢量的至少一个分量的观测方程式。状态方程式、观测方程式和观测矢量序列用于使用卡尔曼滤波器算法来标识声道共振矢量序列。在一个实施例中,基于对非线性函数的分段线性逼近来定义观测方程式。基于预定义的区域来选择线性逼近的参数,这些区域根据声道共振矢量的粗略估算来确定。
-
公开(公告)号:CN1591574A
公开(公告)日:2005-03-09
申请号:CN200410068536.3
申请日:2004-08-25
Applicant: 微软公司
CPC classification number: G10L21/0208 , G10L15/20
Abstract: 提供了一种减少语音信号中的噪声的系统和方法。该系统和方法将含噪声的语音信号分解成一谐波分量和一剩余分量。然后将谐波分量和剩余分量组合成总和来形成一经降噪的值。在一些实施例中,该总和是加权总和,其中将谐波分量乘以一比例缩放因子。在一些实施例中,在语音识别中使用经降噪的值。
-
公开(公告)号:CN101887728A
公开(公告)日:2010-11-17
申请号:CN201010167431.9
申请日:2004-11-26
Applicant: 微软公司
IPC: G10L21/02
CPC classification number: G10L21/0208 , G10L2021/02165
Abstract: 一种方法和系统使用从一不同于气导麦克风的传感器接收的备选传感器信号来估算干净语音值。所述估算或者单独,或者结合气导麦克风信号来使用备选传感器信号。在不使用根据从气导麦克风收集的含噪声的训练数据训练的模型的情况下估算干净语音值。在一个实施例中,向从备选传感器信号形成的矢量添加纠正矢量以形成应用到气导麦克风信号的滤波器,以生成干净语音估算。在其它实施例中,根据备选传感器信号确定语音信号的音调,并将其用于分解气导麦克风信号。分解的信号然后用于确定干净信号估算。
-
公开(公告)号:CN1591574B
公开(公告)日:2010-06-23
申请号:CN200410068536.3
申请日:2004-08-25
Applicant: 微软公司
CPC classification number: G10L21/0208 , G10L15/20
Abstract: 提供了一种减少语音信号中的噪声的系统和方法。该系统和方法将含噪声的语音信号分解成一谐波分量和一剩余分量。然后将谐波分量和剩余分量组合成总和来形成一经降噪的值。在一些实施例中,该总和是加权总和,其中将谐波分量乘以一比例缩放因子。在一些实施例中,在语音识别中使用经降噪的值。
-
公开(公告)号:CN100573664C
公开(公告)日:2009-12-23
申请号:CN200410055738.4
申请日:2004-07-29
Applicant: 微软公司
CPC classification number: H04R1/14 , G10L15/20 , G10L15/24 , G10L25/78 , H04R2460/13
Abstract: 本发明将常规的音频话筒与附加的语音传感器组合起来,语音传感器基于输入提供语音传感器信号。语音传感器信号是基于由说话者在讲话期间采取的动作诸如面部运动、骨振动、喉部阻抗变化等而产生的。语音检测器组件从语音传感器接收输入并输出语音检测信号,表示用户是否正在说话。语音检测器基于话筒信号和语音传感器信号产生语音检测信号。
-
公开(公告)号:CN101305362A
公开(公告)日:2008-11-12
申请号:CN200680041634.5
申请日:2006-10-31
Applicant: 微软公司
CPC classification number: G06F17/30778 , G06F17/30746 , G10L15/197
Abstract: 通过标识语音段的至少两个替换词语序列来索引该语音段。对于该替换序列中的每个词语,信息被置于该索引中该词语的条目中。基于该词语出现在该语音段中的概率与阈值的比较来从该索引中的条目删去语音单元。
-
公开(公告)号:CN1645477A
公开(公告)日:2005-07-27
申请号:CN200510005937.9
申请日:2005-01-20
Applicant: 微软公司
CPC classification number: G10L15/065 , G10L15/063 , G10L2015/0631
Abstract: 一种自动语音识别系统识别用户对口述文本的改变,并推断这类改变是否源自用户改变他/她的主意,或者这类改变是否是识别错误的结果。如果检测到识别错误,则系统使用用户纠正的类型来修改其本身,以降低这类识别错误再次出现的机会。因此,该系统和方法提供了具有极少或没有额外用户交互的意义重大的语音识别学习。
-
-
-
-
-
-
-
-
-