-
公开(公告)号:CN102770863A
公开(公告)日:2012-11-07
申请号:CN201080064700.7
申请日:2010-02-24
Applicant: 三菱电机株式会社
IPC: G06F17/30
CPC classification number: G06F16/31 , G06F17/277
Abstract: 索引生成部(20)将检索对象数据(10)的各名称数据分割为单词单位以及字符单位,计算表示单词单位以及字符单位的始终端的始终端得分,作为列表(名称ID/位置/始终端得分)链接到构成名称数据的各目录,并保存于索引保存部(30)。检索部(40)将输入字符串分解为部分字符串,从索引保存部(30)获取对应的候补目录,根据列表判定候补目录彼此的连续性,赋予与连续性对应的对照得分。
-
公开(公告)号:CN102365639A
公开(公告)日:2012-02-29
申请号:CN201080015020.6
申请日:2010-02-09
Applicant: 三菱电机株式会社
CPC classification number: G06F17/30675 , G10L15/1815
Abstract: 在现有的检索技术中,检索结果具有多个候补时的候补缩小方式的一个方法为了防止候补遗漏而产生庞大数量的候补导致管理成本增大,其他方法由于总是以全部候补为对象进行处理,因此处理时间长,响应性下降。将包括来自于输入单元的输入内容与候补列表的检索历史存储在检索历史存储单元中,按照存储的检索历史内容,由缩小方式选择单元从将检索对象限定为上位候补的方式、与基于过去输入重新检索的方式中选择缩小方法,按照选择的缩小方式从检索历史中设定检索候补及其得分,基于来自于输入单元的字符串以检索用索引为参照由候补得分更新单元更新候补得分,根据更新的候补数及其得分的分布由候补决定单元决定提示候补,参照名称信息数据由候补提示单元对用户提示决定的候补。
-
公开(公告)号:CN101286170A
公开(公告)日:2008-10-15
申请号:CN200810091710.4
申请日:2008-04-09
Applicant: 三菱电机株式会社
CPC classification number: G10L15/197 , G10L15/183 , G10L2015/228
Abstract: 现有的基于声音的文本数据检索在输入声音中的被识别为单词的位置,将单词作为索引词进行全文检索,因此如果在被识别为单词的位置有错误识别,则检索精度低下。在本发明的声音检索装置中,参照根据由学习数据分割单元分割为语言单位的检索对象文本数据而由语言模型作成单元作成的语言模型、对声音特征进行了模型化后的音响模型,由声音识别单元进行输入声音的声音识别,输出音素标记,由对照单位变换单元按照与用比语言模型小的单位分割了的文本检索辞典相同的单位对检索对象文本数据进行分割,使用分割结果,由文本检索单元进行文本检索辞典的检索。
-
公开(公告)号:CN112585674B
公开(公告)日:2024-08-02
申请号:CN201880096683.1
申请日:2018-08-31
Applicant: 三菱电机株式会社
Abstract: 具有:语音识别部(121),其根据表示与一个或多个用户发出的多个讲话对应的语音的语音信号识别语音,将识别出的语音转换为字符串,确定多个讲话,并且确定与多个讲话中的各个讲话对应的时刻;讲话者识别部(122),其从一个或多个用户中识别发出多个讲话中的各个讲话的用户作为讲话者;讲话历史存储部(125),其存储讲话历史信息;意图估计部(123),其估计多个讲话中的各个讲话的意图;命令判定部(130),其参照讲话历史信息,在多个讲话中的最后的讲话与多个讲话中的最后的讲话紧前的一个或多个讲话不是对话的情况下,判定为最后的讲话是用于控制对象的语音命令;以及命令执行部(150),其在判定为最后的讲话是语音命令的情况下,按照根据最后的讲话估计出的意图来控制对象。
-
公开(公告)号:CN112567459A
公开(公告)日:2021-03-26
申请号:CN201880096367.4
申请日:2018-08-24
Applicant: 三菱电机株式会社
IPC: G10L21/028 , G10L21/0308
Abstract: 声音分离系统的声音分离装置(12)具备:特征量抽出部(121),抽出混合声音的声音特征量的时间序列数据;块分割部(122),将声音特征量的时间序列数据分割成具有一定的时间宽度的块;声音分离神经网络(1b),根据块化的声音特征量的时间序列数据,制作多个说话者各自的掩码的时间序列数据;以及声音恢复部(123),从掩码的时间序列数据和混合声音的声音特征量的时间序列数据,恢复多个说话者各自的声音数据。在多个说话者各自的掩码的时间序列数据的制作中,声音分离神经网络(1b)在正向的LSTM神经网络中使用与当前相比在时间上靠前的块的时间序列数据,在逆向的LSTM神经网络中使用与当前相比在时间上靠后的包括预先决定的数量的帧的块的时间序列数据。
-
公开(公告)号:CN102365639B
公开(公告)日:2014-11-26
申请号:CN201080015020.6
申请日:2010-02-09
Applicant: 三菱电机株式会社
CPC classification number: G06F17/30675 , G10L15/1815
Abstract: 在现有的检索技术中,检索结果具有多个候补时的候补缩小方式的一个方法为了防止候补遗漏而产生庞大数量的候补导致管理成本增大,其他方法由于总是以全部候补为对象进行处理,因此处理时间长,响应性下降。将包括来自于输入单元的输入内容与候补列表的检索历史存储在检索历史存储单元中,按照存储的检索历史内容,由缩小方式选择单元从将检索对象限定为上位候补的方式、与基于过去输入重新检索的方式中选择缩小方法,按照选择的缩小方式从检索历史中设定检索候补及其得分,基于来自于输入单元的字符串以检索用索引为参照由候补得分更新单元更新候补得分,根据更新的候补数及其得分的分布由候补决定单元决定提示候补,参照名称信息数据由候补提示单元对用户提示决定的候补。
-
公开(公告)号:CN102341843A
公开(公告)日:2012-02-01
申请号:CN201080010154.9
申请日:2010-01-27
Applicant: 三菱电机株式会社
Abstract: 语音识别是通过与语音模式模型之间的模式匹配来进行的,因此在对宾馆、观光设施名等一个设施需要多个替换词的情况下,成为针对所有的替换词的与语音模式模型之间的模式匹配,运算量变得庞大。另外,难以生成所有的替换词,并且花费很大的劳力。通过语音识别单元使用语言模型和声音模型对输入语音进行语音识别,输出规定个数的由识别得分和文本表述的组构成的识别结果,具备N最优候选重构单元,该N最优候选重构单元将该识别结果与词素词典存储器所保持的词素词典进行对照,检查识别结果的表述是否能够以词素词典的某个词素的组合来表现,在能够表现的情况下修正识别得分,按照修正后的识别得分重新排列位次并作为识别结果。
-
公开(公告)号:CN112567459B
公开(公告)日:2023-12-12
申请号:CN201880096367.4
申请日:2018-08-24
Applicant: 三菱电机株式会社
IPC: G10L21/028 , G10L21/0308
Abstract: 声音分离系统的声音分离装置(12)具备:特征量抽出部(121),抽出混合声音的声音特征量的时间序列数据;块分割部(122),将声音特征量的时间序列数据分割成具有一定的时间宽度的块;声音分离神经网络(1b),根据块化的声音特征量的时间序列数据,制作多个说话者各自的掩码的时间序列数据;以及声音恢复部(123),从掩码的时间序列数据和混合声音的声音特征量的时间序列数据,恢复多个说话者各自的声音数据。在多个说话者各自的掩码的时间序列数据的制作中,声音分离神经网络(1b)在正向的LSTM神经网络中使用与当前相比在时间上靠前的块的时间序列数据,在逆向的LSTM神经网络中使用与当前相比在时间上靠后的包括预先决定的数量
-
公开(公告)号:CN106663421B
公开(公告)日:2018-07-06
申请号:CN201480080290.3
申请日:2014-07-08
Applicant: 三菱电机株式会社
IPC: G10L15/32 , G10L15/065 , G10L15/10
CPC classification number: G10L15/10 , G10L15/01 , G10L15/065 , G10L15/32
Abstract: 本发明的目的在于提供一种能在抑制无用处理的同时,获得妥当性较高的识别效果的技术。声音识别装置(1)包括第1~第3声音识别部(11~13)及控制部(14)。控制部(14)在基于由第1及第2声音识别部(11、12)获取的识别结果,判定为使第3声音识别部(13)识别输入声音的情况下,利用包含由第1及第2声音识别部(11、12)中的至少一方获取的候补字符串的词典,使第3声音识别部(13)识别输入声音。
-
公开(公告)号:CN104823235B
公开(公告)日:2017-07-14
申请号:CN201380019801.6
申请日:2013-11-29
Applicant: 三菱电机株式会社
Abstract: 本发明的声音识别装置包括:声音识别部(2),该声音识别部(2)由能识别预先确定的字串的第一识别引擎、及能识别所述字串的一部分的第二识别引擎构成;以及判定部(4),该判定部(4)基于作为第一及第二识别引擎(2a、2b)的声音识别的识别结果的、第一及第二识别结果候选的时间长度之差,来从第一及第二识别结果候选中采用一个或多个可能的识别结果候选。
-
-
-
-
-
-
-
-
-