-
公开(公告)号:CN101727474B
公开(公告)日:2012-11-14
申请号:CN200910161467.3
申请日:2009-07-31
Applicant: 富士通株式会社
Inventor: 鹫尾信之
IPC: G06F17/30
CPC classification number: G06F17/30241 , G01C21/36
Abstract: 本发明提供检索装置和检索方法。检索装置包含:历史存储部,其在存储部中存储通过检索得到的检索对象和检索日期;关联存储部,其将包含多个与日期有关的语句的日期检索词以及所述检索对象和该检索对象的属性关联起来存储在所述存储部中;变更部,其根据存储在所述存储部中的检索日期和从钟表部输出的日期,变更存储在所述存储部中的日期检索词;受理部,其受理通过声音输入的日期检索词以及所述检索对象或属性;以及提取部,其参照存储在所述存储部中的由所述变更部变更后的日期检索词、检索对象以及属性,提取与由所述受理部受理的日期检索词以及检索对象或属性对应的检索对象。
-
公开(公告)号:CN1920948B
公开(公告)日:2010-05-12
申请号:CN200610006952.X
申请日:2006-01-26
Applicant: 富士通株式会社
CPC classification number: G10L15/22 , G10L2015/088
Abstract: 本发明提供一种语音识别系统及语音处理系统,其中,在用户进行自我修正发音的情况下,如同人们之间的对话一样,可输入并正确识别自我修正发音。所述系统包括:信号处理单元,用于将讲话语音数据转换为特征;语音区段检测单元,用于检测讲话语音数据中的语音区段;优先级确定单元,用于根据预定的优先级标准,从由语音区段检测单元检测的语音区段中选择要给予优先级的语音区段;以及解码器,用于利用由优先级确定单元所选择的语音区段的特征以及声学模型,计算与识别词汇的匹配度。优先级确定单元从由下标准构成的组中所选择的至少一个标准作为预定的优先级标准:语音区段的长度,语音区段的功率或信噪比,以及语音区段的时间顺序。
-
公开(公告)号:CN101636784A
公开(公告)日:2010-01-27
申请号:CN200780052250.8
申请日:2007-03-20
Applicant: 富士通株式会社
CPC classification number: G10L15/05
Abstract: 语音识别系统(1)具有:特征量计算部(2);声音级别计算部(6),其计算各帧的输入声音级别;对照部(7),其将各帧的特征量与声学模型和语言模型进行对照,并输出识别单词串;始点判断部(31),其根据基准值来确定语音区间的始点帧;终点判断部(32),其根据基准值来确定语音区间的终点帧;以及基准值更新部(4),其根据输入声音级别的变动来更新基准值。始点判断部(31)在每次基准值被更新时更新始点帧,对照部(7)在终点帧之前开始对照,并在每次接收到始点帧的通知时修改对照结果。语音识别系统(1)能够进行基于适当语音区间的语音识别,并能够抑制响应时间延迟。
-
公开(公告)号:CN101547261B
公开(公告)日:2013-06-05
申请号:CN200810190522.7
申请日:2008-12-30
Applicant: 富士通株式会社
Inventor: 鹫尾信之
CPC classification number: H04M3/4936 , G10L15/26 , G10L17/00 , H04M2201/405
Abstract: 本发明提供在基于各个通话的多个语音数据内,将要件相连续的语音数据关联成为一连串的语音数据的关联赋予装置、关联赋予方法和记录介质。关联赋予装置根据针对所选择的语音数据的语音识别处理的结果,导出各语音数据之间所共用的、且与要件内容有关的要件语句的出现率的数值,作为要件相似度(S102)。并且,关联赋予装置导出表示从多个语音数据中提取出的语音的特征的比较结果的相似度,作为说话者相似度(S103)。然后,关联赋予装置根据要件相似度和说话者相似度,导出表示所选择的多个语音数据相关联的可能性的关联度(S104),并在关联度为预先设定的阈值以上的情况下,将所选择的多个语音数据关联起来(S105)。
-
公开(公告)号:CN101636784B
公开(公告)日:2011-12-28
申请号:CN200780052250.8
申请日:2007-03-20
Applicant: 富士通株式会社
CPC classification number: G10L15/05
Abstract: 语音识别系统(1)具有:特征量计算部(2);声音级别计算部(6),其计算各帧的输入声音级别;对照部(7),其将各帧的特征量与声学模型和语言模型进行对照,并输出识别单词串;始点判断部(31),其根据基准值来确定语音区间的始点帧;终点判断部(32),其根据基准值来确定语音区间的终点帧;以及基准值更新部(4),其根据输入声音级别的变动来更新基准值。始点判断部(31)在每次基准值被更新时更新始点帧,对照部(7)在终点帧之前开始对照,并在每次接收到始点帧的通知时修改对照结果。语音识别系统(1)能够进行基于适当语音区间的语音识别,并能够抑制响应时间延迟。
-
公开(公告)号:CN101547261A
公开(公告)日:2009-09-30
申请号:CN200810190522.7
申请日:2008-12-30
Applicant: 富士通株式会社
Inventor: 鹫尾信之
CPC classification number: H04M3/4936 , G10L15/26 , G10L17/00 , H04M2201/405
Abstract: 本发明提供在基于各个通话的多个语音数据内,将要件相连续的语音数据关联成为一连串的语音数据的关联赋予装置、关联赋予方法和记录介质。关联赋予装置根据针对所选择的语音数据的语音识别处理的结果,导出各语音数据之间所共用的、且与要件内容有关的要件语句的出现率的数值,作为要件相似度(S102)。并且,关联赋予装置导出表示从多个语音数据中提取出的语音的特征的比较结果的相似度,作为说话者相似度(S103)。然后,关联赋予装置根据要件相似度和说话者相似度,导出表示所选择的多个语音数据相关联的可能性的关联度(S104),并在关联度为预先设定的阈值以上的情况下,将所选择的多个语音数据关联起来(S105)。
-
公开(公告)号:CN101042866B
公开(公告)日:2012-07-04
申请号:CN200610107718.6
申请日:2006-07-20
Applicant: 富士通株式会社
Inventor: 鹫尾信之
CPC classification number: G10L15/22 , G10L2015/221
Abstract: 提供了语音识别设备、语音识别方法以及记录有计算机程序的记录介质,其中,即使在独立地或另选地采用语音识别语法时,也改进了语音识别响应。接收话音数据。然后,保持语音识别结果的输出延缓状态,直到发声部分之后的无声区间的持续时间达到基准时间为止。存储指示单词序列的末尾单词是否是最终单词的信息。基于语言模型,提取识别候选单词序列。当判定提取的单词序列的末尾单词为最终单词时,以比基准时间短的时间输出语音识别结果,而在判定末尾单词不是最终单词时,在基准时间已经过去的时间处输出语音识别结果。
-
公开(公告)号:CN101727474A
公开(公告)日:2010-06-09
申请号:CN200910161467.3
申请日:2009-07-31
Applicant: 富士通株式会社
Inventor: 鹫尾信之
IPC: G06F17/30
CPC classification number: G06F17/30241 , G01C21/36
Abstract: 本发明提供检索装置和检索方法。检索装置包含:历史存储部,其在存储部中存储通过检索得到的检索对象和检索日期;关联存储部,其将包含多个与日期有关的语句的日期检索词以及所述检索对象和该检索对象的属性关联起来存储在所述存储部中;变更部,其根据存储在所述存储部中的检索日期和从钟表部输出的日期,变更存储在所述存储部中的日期检索词;受理部,其受理通过声音输入的日期检索词以及所述检索对象或属性;以及提取部,其参照存储在所述存储部中的由所述变更部变更后的日期检索词、检索对象以及属性,提取与由所述受理部受理的日期检索词以及检索对象或属性对应的检索对象。
-
公开(公告)号:CN101042866A
公开(公告)日:2007-09-26
申请号:CN200610107718.6
申请日:2006-07-20
Applicant: 富士通株式会社
Inventor: 鹫尾信之
CPC classification number: G10L15/22 , G10L2015/221
Abstract: 提供了语音识别设备、语音识别方法以及记录有计算机程序的记录介质,其中,即使在独立地或另选地采用语音识别语法时,也改进了语音识别响应。接收话音数据。然后,保持语音识别结果的输出延缓状态,直到发声部分之后的无声区间的持续时间达到基准时间为止。存储指示单词序列的末尾单词是否是最终单词的信息。基于语言模型,提取识别候选单词序列。当判定提取的单词序列的末尾单词为最终单词时,以比基准时间短的时间输出语音识别结果,而在判定末尾单词不是最终单词时,在基准时间已经过去的时间处输出语音识别结果。
-
公开(公告)号:CN1920948A
公开(公告)日:2007-02-28
申请号:CN200610006952.X
申请日:2006-01-26
Applicant: 富士通株式会社
CPC classification number: G10L15/22 , G10L2015/088
Abstract: 本发明提供一种语音识别系统及语音处理系统,其中,在用户进行自我修正发音的情况下,如同人们之间的对话一样,可输入并正确识别自我修正发音。所述系统包括:信号处理单元,用于将讲话语音数据转换为特征;语音区段检测单元,用于检测讲话语音数据中的语音区段;优先级确定单元,用于根据预定的优先级标准,从由语音区段检测单元检测的语音区段中选择要给予优先级的语音区段;以及解码器,用于利用由优先级确定单元所选择的语音区段的特征以及声学模型,计算与识别词汇的匹配度。优先级确定单元从由下标准构成的组中所选择的至少一个标准作为预定的优先级标准:语音区段的长度,语音区段的功率或信噪比,以及语音区段的时间顺序。
-
-
-
-
-
-
-
-
-