语音识别装置和方法
    1.
    发明授权

    公开(公告)号:CN101188109B

    公开(公告)日:2011-01-19

    申请号:CN200710188793.4

    申请日:2007-11-20

    Inventor: 原田将治

    CPC classification number: G10L15/08

    Abstract: 本发明提供了语音识别装置、方法和记录有语音识别软件程序的记录介质。当识别对象单词的相似度大于第二阈值时,语音验证单元输出识别对象单词作为识别结果,并且当识别对象单词的相似度小于第二阈值时,如果该识别对象单词的相似度大于第一阈值并且同时该识别对象单词的相似度大于抛弃对象单词的相似度,则语音验证单元输出识别对象单词作为识别结果。应该注意,第一阈值是用于抛弃输入语音的量度。第二阈值大于第一阈值并且用作用于输出作为识别结果的识别对象单词的量度。

    语音识别系统及语音处理系统

    公开(公告)号:CN1920948B

    公开(公告)日:2010-05-12

    申请号:CN200610006952.X

    申请日:2006-01-26

    CPC classification number: G10L15/22 G10L2015/088

    Abstract: 本发明提供一种语音识别系统及语音处理系统,其中,在用户进行自我修正发音的情况下,如同人们之间的对话一样,可输入并正确识别自我修正发音。所述系统包括:信号处理单元,用于将讲话语音数据转换为特征;语音区段检测单元,用于检测讲话语音数据中的语音区段;优先级确定单元,用于根据预定的优先级标准,从由语音区段检测单元检测的语音区段中选择要给予优先级的语音区段;以及解码器,用于利用由优先级确定单元所选择的语音区段的特征以及声学模型,计算与识别词汇的匹配度。优先级确定单元从由下标准构成的组中所选择的至少一个标准作为预定的优先级标准:语音区段的长度,语音区段的功率或信噪比,以及语音区段的时间顺序。

    语音识别装置、方法和记录有语音识别软件程序的记录介质

    公开(公告)号:CN101188109A

    公开(公告)日:2008-05-28

    申请号:CN200710188793.4

    申请日:2007-11-20

    Inventor: 原田将治

    CPC classification number: G10L15/08

    Abstract: 本发明提供了语音识别装置、方法和记录有语音识别软件程序的记录介质。当识别候选项的相似度大于第二阈值时,语音验证单元输出识别候选项作为识别结果,并且当识别候选项的相似度小于第二阈值时,如果该识别候选项的相似度大于第一阈值并且同时该识别候选项的相似度大于抛弃候选项的相似度,则语音验证单元输出识别候选项作为识别结果。应该注意,第一阈值是用于抛弃输入语音的量度。第二阈值大于第一阈值并且用作用于输出作为识别结果的识别候选项的量度。

    语音识别装置及语音识别方法

    公开(公告)号:CN101046957B

    公开(公告)日:2010-12-08

    申请号:CN200610108984.0

    申请日:2006-07-31

    Inventor: 原田将治

    CPC classification number: G10L2015/228

    Abstract: 语音识别装置、语音识别方法及存储语音识别程序的记录介质。一种语音识别装置,用于识别包含在语音中的多个连续关联的单词,该装置包括:声学模型读取部分,用于读取声学模型;字典管理部分,用于从字典数据中读取所需数据;和识别部分,用于利用所述声学模型,通过将由字典数据表示的一组单词与所输入的语音进行匹配来连续识别所述多个连续单词,其中,所述字典数据包括表示单词起始部分的起始部分字典和存储有表示结尾部分的数据的一组结尾部分字典,根据所述识别部分识别的所述单词来读取所述结尾部分字典和/或所述起始部分字典,并且当所述字典管理部分读取所述结尾部分字典和/或所述起始部分字典时,所述识别部分将后续语音与包含在所述起始部分字典内的单词起始部分进行匹配。由此,所述语音识别装置可消除由于从对存储器有所限制的设备内的辅助存储装置中读取单词字典所造成的语音识别处理中的延迟。

    声音识别装置、声音识别方法以及声音识别程序

    公开(公告)号:CN101689364A

    公开(公告)日:2010-03-31

    申请号:CN200780053719.X

    申请日:2007-07-09

    Inventor: 原田将治

    CPC classification number: G10L15/10 G10L2015/025

    Abstract: 本发明提供声音识别装置、声音识别方法以及声音识别程序。该声音识别装置(1)具有声音核对部(17),声音核对部(17)计算由声音分析部(11)转换的特征量和由词模型生成部(16)生成的词模型之间的各时刻的相似度。声音核对部(17)提取由词模型生成部(16)生成的词模型中的这样的词模型:在各时刻的相似度中最小的相似度或者由各时刻的相似度获得的整体相似度满足第2阈值条件,且说话声音的发声区间中、对应于与第1阈值条件对应的音素或音素串的区间内的各时刻的相似度满足第1阈值条件,声音核对部(17)将与提取出的词模型对应的识别词作为识别结果来输出。

    语音识别系统及语音处理系统

    公开(公告)号:CN1920948A

    公开(公告)日:2007-02-28

    申请号:CN200610006952.X

    申请日:2006-01-26

    CPC classification number: G10L15/22 G10L2015/088

    Abstract: 本发明提供一种语音识别系统及语音处理系统,其中,在用户进行自我修正发音的情况下,如同人们之间的对话一样,可输入并正确识别自我修正发音。所述系统包括:信号处理单元,用于将讲话语音数据转换为特征;语音区段检测单元,用于检测讲话语音数据中的语音区段;优先级确定单元,用于根据预定的优先级标准,从由语音区段检测单元检测的语音区段中选择要给予优先级的语音区段;以及解码器,用于利用由优先级确定单元所选择的语音区段的特征以及声学模型,计算与识别词汇的匹配度。优先级确定单元从由下标准构成的组中所选择的至少一个标准作为预定的优先级标准:语音区段的长度,语音区段的功率或信噪比,以及语音区段的时间顺序。

    语音识别系统及语音识别方法

    公开(公告)号:CN101636784B

    公开(公告)日:2011-12-28

    申请号:CN200780052250.8

    申请日:2007-03-20

    CPC classification number: G10L15/05

    Abstract: 语音识别系统(1)具有:特征量计算部(2);声音级别计算部(6),其计算各帧的输入声音级别;对照部(7),其将各帧的特征量与声学模型和语言模型进行对照,并输出识别单词串;始点判断部(31),其根据基准值来确定语音区间的始点帧;终点判断部(32),其根据基准值来确定语音区间的终点帧;以及基准值更新部(4),其根据输入声音级别的变动来更新基准值。始点判断部(31)在每次基准值被更新时更新始点帧,对照部(7)在终点帧之前开始对照,并在每次接收到始点帧的通知时修改对照结果。语音识别系统(1)能够进行基于适当语音区间的语音识别,并能够抑制响应时间延迟。

    声音识别装置和声音识别方法

    公开(公告)号:CN101689364B

    公开(公告)日:2011-11-23

    申请号:CN200780053719.X

    申请日:2007-07-09

    Inventor: 原田将治

    CPC classification number: G10L15/10 G10L2015/025

    Abstract: 本发明提供声音识别装置和声音识别方法。该声音识别装置(1)具有声音核对部(17),声音核对部(17)计算由声音分析部(11)转换的特征量和由词模型生成部(16)生成的词模型之间的各时刻的相似度。声音核对部(17)提取由词模型生成部(16)生成的词模型中的这样的词模型:在各时刻的相似度中最小的相似度或者由各时刻的相似度获得的整体相似度满足第2阈值条件,且说话声音的发声区间中、对应于与第1阈值条件对应的音素或音素串的区间内的各时刻的相似度满足第1阈值条件,声音核对部(17)将与提取出的词模型对应的识别词作为识别结果来输出。

    识别装置、识别方法、生成装置和生成方法

    公开(公告)号:CN103050115A

    公开(公告)日:2013-04-17

    申请号:CN201210313705.X

    申请日:2012-08-29

    Inventor: 原田将治

    CPC classification number: G10L15/19 G10L15/10 G10L2015/027

    Abstract: 本发明涉及识别装置、识别方法、生成装置和生成方法。根据本发明的识别装置包括存储器、第一计算单元、第二计算单元和确定单元。存储器存储语句中包括的词和指示词在语句中的位置的位置信息。第一计算单元将输入语音信号与连接存储器中存储的多个词的字符串的阅读信息相比较以计算相似度。第二计算单元基于存储器中存储的词的位置信息来计算指示多个连接的词之间接近度的连接得分。确定单元基于相似度和连接得分来确定对应于语音信号的字符串。

    声音识别装置和声音识别方法

    公开(公告)号:CN101625864B

    公开(公告)日:2011-11-09

    申请号:CN200910136975.6

    申请日:2009-04-30

    Inventor: 原田将治

    CPC classification number: G10L15/08 G10L2015/025

    Abstract: 本发明提供一种声音识别装置和声音识别方法。在对登记在单词辞典中的识别单词赋予舍弃单词时,声音分析部从与多个舍弃单词候选分别对应的多个声音数据中分别提取特征参数。声音对照部计算由声音分析部提取出的特征参数、与由单词模型生成部生成的各识别单词的单词模型之间的似然度。结果判定部针对各特征参数将似然度最高的单词模型作为识别结果。舍弃单词生成部根据针对各特征参数的识别结果,对于每一个舍弃单词候选,对希望登记舍弃单词的识别单词是识别结果的发音数进行计数,将所计数的发音数最多的舍弃单词候选作为与识别单词对应的舍弃单词登记在单词辞典中。

Patent Agency Ranking