-
公开(公告)号:CN106663421B
公开(公告)日:2018-07-06
申请号:CN201480080290.3
申请日:2014-07-08
Applicant: 三菱电机株式会社
IPC: G10L15/32 , G10L15/065 , G10L15/10
CPC classification number: G10L15/10 , G10L15/01 , G10L15/065 , G10L15/32
Abstract: 本发明的目的在于提供一种能在抑制无用处理的同时,获得妥当性较高的识别效果的技术。声音识别装置(1)包括第1~第3声音识别部(11~13)及控制部(14)。控制部(14)在基于由第1及第2声音识别部(11、12)获取的识别结果,判定为使第3声音识别部(13)识别输入声音的情况下,利用包含由第1及第2声音识别部(11、12)中的至少一方获取的候补字符串的词典,使第3声音识别部(13)识别输入声音。
-
公开(公告)号:CN104038864B
公开(公告)日:2018-04-10
申请号:CN201410081236.2
申请日:2014-03-07
Applicant: 亚德诺半导体股份有限公司
Inventor: M·莫尔滕森
CPC classification number: G10L15/28 , G10L15/02 , G10L15/063 , G10L15/08 , G10L15/10 , G10L15/22 , G10L15/265 , H04R3/00 , H04R2225/43
Abstract: 本发明涉及带有语音识别的麦克风电路总成和系统。所述麦克风电路总成包括麦克风前置放大器和模拟‑数字转换器以以第一预定采样速率生成麦克风信号样本。语音特征提取器被配置为接收和处理麦克风信号样本预定块以提取表示所述麦克风信号样本的语音特征的语音特征向量。所述麦克风电路总成还包括语音词汇表,其包括被编码为目标特征向量集的人类语音的目标词或目标短语,以及判定电路,其被配置为将所述语音特征提取器生成的所述语音特征向量与所述目标特征向量进行比较以检测目标语音词或短语。控制器被配置为在所述麦克风电路总成的外部可接入输出端上生成识别信号以响应所述麦克风信号样本中被识别的目标词或短语。
-
公开(公告)号:CN107886942A
公开(公告)日:2018-04-06
申请号:CN201711055574.9
申请日:2017-10-31
Applicant: 东南大学
CPC classification number: G10L15/02 , G10L15/063 , G10L15/08 , G10L15/10 , G10L25/63 , G10L2015/0631
Abstract: 本发明公开了一种基于局部惩罚随机谱回归的语音信号情感识别方法,对带有情感信息的语段信号样本进行副语言特征提取、数据映射、局部惩罚嵌入图设计和图分解、回归、分类器分类判决。其中在数据映射阶段,使用了随机生成点进行非线性特征映射;在局部惩罚嵌入图设计和图分解阶段,使用了局部惩罚嵌入图,以加大对类间边缘样本对之间的惩罚权重,生成训练样本的虚拟坐标。与现有方法相比,本发明的方法在语音信号情感识别方面,能够有效地提升系统的识别性能。
-
公开(公告)号:CN107710322A
公开(公告)日:2018-02-16
申请号:CN201680037071.6
申请日:2016-06-03
Applicant: 雅马哈株式会社
IPC: G10L15/00 , G10L13/02 , G10L15/10 , G10L19/018 , G06F3/16
CPC classification number: G10L19/018 , G06F3/16 , G06F17/2775 , G10L13/02 , G10L15/00 , G10L15/10 , G10L15/26 , G10L21/10 , G10L2021/065
Abstract: 一种信息提供系统(1),包括:声音拾取单元(22),其用于拾取指导语音并产生语音信号(SG);字符串指定单元(114),其用于指定表示不同的指导语音(V)的发音细节的多个注册字符串中的与表示通过对语音信号(SG)进行语音识别而分析出指导语音的发音细节的语音字符串(L)类似的注册字符串;以及发声单元(26),其用于从对应于不同的指导语音的多组指导信息(G)当中将表达由字符串指定单元(114)指定的注册字符串的分布信息(D)发送至可向用户(U)呈现与分布信息(D)对应的指导信息(G)的终端装置。
-
公开(公告)号:CN107424603A
公开(公告)日:2017-12-01
申请号:CN201710444603.4
申请日:2017-06-13
Applicant: 云南天罡北斗信息科技有限公司
CPC classification number: G10L15/02 , G10L15/10 , G10L15/22 , G10L25/54 , G10L2015/221
Abstract: 本发明公开了一种听力言语障碍残疾人的语音逆变器,包括语音处理DSP电路、语音A/D采样电路、数据存储flash电路、JTAG电路、电源电路;所述语音处理DSP电路用于语音处理;所述语音A/D采样电路用于语音信号采集;所述数据存储flash电路用于存储编译后系统软件的数据;所述语音处理DSP电路分别与语音A/D采样电路连接、数据存储flash电路、电源电路、JTAG电路连接。本发明提供一种听力言语障碍残疾人的语音逆变器,APP程序通过采样,形成特定残疾人的语音模型库,然后将采样拾取进来的语音混不清的,与形成的语音模型库比对后,将这种声音翻译为标准的普通话,并以特定的男生或女生通过设备输出。
-
公开(公告)号:CN107256455A
公开(公告)日:2017-10-17
申请号:CN201710398916.0
申请日:2017-05-31
Applicant: 中南大学
CPC classification number: G10L15/04 , G06Q10/0639 , G10L15/10 , G10L15/142 , G10L15/26 , G10L25/51
Abstract: 本发明提供一种生涯规划测试方法及系统,包括:对工作者所需要的技能进行分类,并构建预先获取的题目与所述技能的对应关系;通过语音识别,获取用户给出的所述题目的答题结果;根据所述题目的编号和所述题目的答题结果,获取所述题目的得分;根据所述题目的得分,计算同一类的所述技能对应的题目的总分,并获取分析结果。本发明直接从工作者所需要的技能出发,对所述技能进行分类,每类技能对应有相应的题目,根据用户使用语音识别技术给出的题目的答案,获取题目的得分,统计每类技能对应的题目的总分,根据所述总分针对每类技能给出分析结果,从而提高测试的准确性,使用户通过测试对自己的技能有准确认识。
-
公开(公告)号:CN107195296A
公开(公告)日:2017-09-22
申请号:CN201610146356.5
申请日:2016-03-15
Applicant: 阿里巴巴集团控股有限公司
IPC: G10L15/02 , G10L15/08 , G10L15/10 , G10L15/14 , G10L15/183
CPC classification number: G10L15/02 , G10L15/08 , G10L15/10 , G10L15/14 , G10L15/183
Abstract: 本申请实施例中提供了一种语音识别方法、装置、终端及系统,该方法包括:接收待识别语音;对待识别语音进行特征提取,得到特征信息;将特征信息输入加权有限状态转换器WFST进行识别,其中,该WFST是由预先创建的声学模型、发音词典、语言模型组合得到的,该声学模型中的各第一语种音素与第二语种音素存在对应关系,该发音词典中的各第一语种词语由第二语种音素注音。采用本申请中的方案,能够提升语音识别准确率。
-
公开(公告)号:CN106814909A
公开(公告)日:2017-06-09
申请号:CN201611233206.4
申请日:2016-11-25
Applicant: 泰勒斯公司
IPC: G06F3/041 , G06F3/0488 , G10L15/22 , B64D43/00
CPC classification number: G10L15/22 , G06F3/0488 , G06F3/16 , G08G5/0021 , G10L15/10 , G10L2015/223 , G06F3/0416 , B64D43/00
Abstract: 本发明公开了使用包括语音识别单元的用于飞行器的人机界面装置的方法。本发明的一般领域涉及使用用于飞行器的人机界面装置的方法的领域,该人机界面装置至少包括:一个语音识别单元(13)、一个具有触摸界面(11)的显示装置(10),一个图形界面计算机(12)以及一个电子计算单元(14),该装置设计成图形显示多个命令,每一命令至少分类成第一类和第二类,其中第一类称为关键类,而第二类称为非关键类,每一非关键命令具有多个选项,每一选项具有一个名称,所述名称集合在称为“词典”的数据库(140)中。根据本发明的方法包括如下步骤:识别显示的命令,启动语音识别单元,比较触摸和语音信息以及确认步骤。
-
公开(公告)号:CN106598536A
公开(公告)日:2017-04-26
申请号:CN201610985213.3
申请日:2016-10-31
Applicant: 深圳众思科技有限公司
Inventor: 张栋
CPC classification number: G06F3/16 , G10L15/10 , G11B20/10527 , G11B2020/10546
Abstract: 本发明提供一种电子设备的录音启动方法、装置及电子设备,属于电子设备技术领域。该电子设备的录音启动方法包括:采集用户输入的语音信息,获取语音信息对应的语义信息;若语义信息与预设语义信息相匹配,确定启动录音操作。本发明提供的电子设备的录音启动方法、装置及电子设备,提高了电子设备的智能化。
-
公开(公告)号:CN105653517A
公开(公告)日:2016-06-08
申请号:CN201510744496.8
申请日:2015-11-05
Applicant: 乐视致新电子科技(天津)有限公司
Inventor: 王育军
IPC: G06F17/27
CPC classification number: G10L15/10 , G10L15/005 , G10L15/01 , G10L15/28 , G06F17/2765
Abstract: 本发明实施例提供一种识别率确定方法及装置,方法为,获取语音识别装置识别得到的字符串,以及该字符串对应的标准识别结果,其中,所述标准识别结果包括表音字符和中文字符;对所述字符串进行切分,生成字符序列;且对所述标准识别结果进行切分,生成标准标识结果序列;计算生成的标准标识结果序列和字符序列之间的最小编辑距离;根据计算得到的最小编辑距离,确定语音识别装置的识别率。采用本发明实施例技术方案,将识别得到的字符串和标准识别结果中的中文字符(和数字)和英文单词作为评测单元,将一个英文单词视为一个整体,避免了将单词中的每一个字符作为一个元素进行处理时造成的计算结果错误率增加的问题,提高了计算结果的准确性。
-
-
-
-
-
-
-
-
-