内容标记附加支持装置及内容标记附加支持方法

    公开(公告)号:CN101199018A

    公开(公告)日:2008-06-11

    申请号:CN200680021157.6

    申请日:2006-06-12

    Abstract: 能够由一个人进行标记附加作业和标记修正作业,且能够抑制作业时间的增加的内容标记附加支持装置。在该装置中,语音识别单元(104)对输入的语音进行识别处理。标记生成单元(103)将通过语音识别处理所获得的数据作为标记,赋予给内容重放单元(101)所重放的内容。标记修正单元(108)向标记生成单元(103)传送标记修正信息,同时向内容重放控制单元(109)传送标记修正开始结束通知信息。内容重放控制单元(109)对内容重放单元(101)进行控制,以便与标记修正作业的开始同步地暂时停止内容的重放,以及与标记修正作业的结束同步地重新开始内容的重放。

    说话人标准化方法及用该方法的语音识别装置

    公开(公告)号:CN1312656C

    公开(公告)日:2007-04-25

    申请号:CN03160348.3

    申请日:2003-09-24

    CPC classification number: G10L17/12

    Abstract: 将输入语音切分为一定时间长度作为帧,抽取每帧的音响特征量,利用预先规定的多个频率变换系数将所述音响特征量进行频率变换。利用通过频率变换得到的多个变换后特征量及至少1个标准音韵模型的全部组合,计算每帧的变换后特征量与标准音韵模型的多个类似度或距离,利用该多个类似度或距离,决定使输入语音标准化用的频率变换条件,利用决定的频率变换条件使输入语音标准化。根据该方法,即使发出语音的说话人调换,也能够补偿输入语音的个人差别,提高语音识别性能。

    说话人标准化方法及用该方法的语音识别装置

    公开(公告)号:CN1494053A

    公开(公告)日:2004-05-05

    申请号:CN03160348.3

    申请日:2003-09-24

    CPC classification number: G10L17/12

    Abstract: 将输入语音切分为一定时间长度作为帧,抽取每帧的音响特征量,利用预先规定的多个频率变换系数将所述音响特征量进行频率变换。利用通过频率变换得到的多个变换后特征量及至少1个标准音韵模型的全部组合,计算每帧的变换后特征量与标准音韵模型的多个类似度或距离,利用该多个类似度或距离,决定使输入语音标准化用的频率变换条件,利用决定的频率变换条件使输入语音标准化。根据该方法,即使发出语音的说话人调换,也能够补偿输入语音的个人差别,提高语音识别性能。

Patent Agency Ranking