特定音响信号含有区间检测系统及其方法以及程序

    公开(公告)号:CN1910651A

    公开(公告)日:2007-02-07

    申请号:CN200580002496.5

    申请日:2005-07-01

    Abstract: 本发明是在储存信号中检测包含与参考信号相似的区间的特定音响信号含有区间检测系统。具有:参考信号频谱图分割部,将参考信号频谱图分割成小区域参考信号频谱图;小区域参考信号频谱图代码化部,对小区域参考信号频谱图进行代码化,作为参考信号小区域代码;小区域储存信号频谱图代码化部,对小区域储存信号频谱图进行代码化,作为储存信号小区域代码;相似小区域频谱图检测部,通过代码相似度求出和小区域参考信号频谱图相似的小区域频谱图;区间相似度计算部,用小区域相似度,求出储存信号的区间和参考信号的相似度。

    指令信号产生设备和方法
    23.
    发明公开

    公开(公告)号:CN1573925A

    公开(公告)日:2005-02-02

    申请号:CN200410076690.5

    申请日:2004-05-13

    CPC classification number: G10L25/87 G10L15/10 G10L2015/088 G10L2015/223

    Abstract: 公开了一种指令信号产生设备,用来响应于至少一个启动关键字产生将要输出给一个外部设备的指令信号,该设备包括:语音输入装置,用来数字化地输入一个包含多个时间上相互分离的分离语音片断的语音;分离语音片断检测装置,用来检测所述输入语音的所述分离语音片断;分离语音判断装置,用来判断是否将所述的分离语音片断识别为一个分离声音;语音识别词典存储装置,用来存储包含有关启动关键字的启动关键字信息的语音识别词典;和语音识别执行装置,用来在存储在语音识别词典存储装置中的语音识别词典的基础上、执行语音识别来判断被识别为分离声音的所述分离语音片断是否代表所述的启动关键字。

    语音识别方法
    25.
    发明授权

    公开(公告)号:CN1125437C

    公开(公告)日:2003-10-22

    申请号:CN99105366.4

    申请日:1999-04-28

    CPC classification number: G10L15/10 G10L15/12 G10L2015/223 H04M1/271

    Abstract: 语音拨号方法包括:如果用户输入电话号码和对应于电话号码的语音时,仅检测语音分段,提取并存储检测的语音分段的特征的训练步骤;如果接收到输入语音,仅检测语音分段,提取检测的语音分段的特征,把提取的特征与在训练步骤中存储的寄存字的特征比较,选择具有与输入语音特征最类似的特征的寄存字的识别步骤;如果在识别步骤中选择的寄存字的类似性没有超过预定阈值,则确定识别的结果是正确的和自动地拨对应于识别字的电话号码的步骤。

    基于决策树的语音辨别
    26.
    发明公开

    公开(公告)号:CN1420486A

    公开(公告)日:2003-05-28

    申请号:CN02148751.0

    申请日:2002-11-15

    Inventor: 李恒舜

    CPC classification number: G10L15/10 G10L15/08 G10L15/14

    Abstract: 本发明公开了一种建立至少一个决策树以处理表现语音的样本信号的方法(200)。该方法包括依据音素的分段统计语音模型,提供模型子向量,该模型包括平均值和关联的方差值的诸多向量。然后,对平均值的模型子向量进行统计分析,以提供指示子向量之间相对最大方差的方向预测向量,此后,计算多个预测向量的预测值(240)。依据预测值的范围分析,确定潜在阈值(260)。最后提供有决策能力的决策树(270),把模型子向量分成多个组,这些组是决策树树叶。该决策基于从潜在阈值选择的已选择阈值,已选择阈值通过该模型子向量之间的方差变化来选择,该方差依据该平均值和关联的方差值来确定。本发明还说明了使用建立决策树方法进行语音辨别(300)的方法。

    语音识别系统
    27.
    发明公开

    公开(公告)号:CN1346125A

    公开(公告)日:2002-04-24

    申请号:CN01137997.9

    申请日:2001-09-29

    CPC classification number: G10L21/0208 G10L15/10 G10L15/144 G10L15/20

    Abstract: 在扬声器适配的时候,第一特征向量生成部分(7,8,9)生成从中除去加性噪声和倍增噪声的特征向量。第二特征向量生成部分(12)生成包括加性噪声和倍增噪声的特征的特征向量序列[Si,M]。路径搜索部分(10)通过比较特征向量序列[ci,M]和标准语音HMM(300)的标准向量[an,M]来处理路径搜索。当扬声器适配部分(11)处理在与路径搜索结果Dv相一致的标准向量[an,M]的平均特征向量[s∧n,M]和特征向量[si,M]的相关操作的时候,生成自适应向量[xn,M]。自适应向量[xn,M]更新用于语音识别的扬声器自适应声音模型(400)的特征向量。

    用于数字助理服务中的语音匹配的方法和系统

    公开(公告)号:CN108874766A

    公开(公告)日:2018-11-23

    申请号:CN201810072173.2

    申请日:2018-01-25

    Applicant: 苹果公司

    Abstract: 本发明题为“用于数字助理服务中的语音匹配的方法和系统”。本发明提供了用于操作智能自动助理以基于语音匹配技术来提供媒体项目的系统和过程。示例性方法包括接收来自用户的言语输入和确定该言语输入是否包括对媒体项目的用户请求。该方法还包括根据确定所述言语输入包括对获得媒体项目的用户请求,从多个媒体项目来确定候选媒体项目。该方法进一步包括基于候选媒体项目的语音表示和言语输入的语音表示之间的差值来确定是否要将候选媒体项目提供给用户。该方法进一步包括根据确定要将候选媒体项目提供给用户,将所述候选媒体项目提供给所述用户。

Patent Agency Ranking