-
公开(公告)号:CN106856093A
公开(公告)日:2017-06-16
申请号:CN201710102948.1
申请日:2017-02-23
Applicant: 海信集团有限公司
IPC: G10L19/005 , G10L15/22
Abstract: 本发明公开了一种音频信息处理方法、智能终端及语音控制终端,属于终端技术领域。该方法包括:接收语音控制终端发送的音频信息,该音频信息包括至少两个语音压缩包和每个语音压缩包对应的语音压缩包标识;基于该语音压缩包标识确定该音频信息中是否丢失语音压缩包;当音频信息中丢失语音压缩包时,基于与丢失的语音压缩包相邻的语音压缩包的发音信息,在丢失语音压缩包的位置处添加语音补偿信息,得到优化音频信息,该语音补偿信息为能够与该相邻的至少一个语音压缩包的发音信息实现平滑过渡的音频信息;对该优化音频信息进行语音识别。本发明通过在丢失语音压缩包的位置处添加语音补偿信息,从而提高了智能终端对音频信息进行语音识别的正确率。
-
公开(公告)号:CN105721651A
公开(公告)日:2016-06-29
申请号:CN201610034405.6
申请日:2016-01-19
Applicant: 海信集团有限公司
IPC: H04M1/27
CPC classification number: H04M1/271
Abstract: 本发明公开了一种语音拨号方法和设备,涉及无线通信技术领域,用以解决语音拨号需要用户确认,效率比较低问题。本发明实施例根据采集的第一用户的语音,确定需要呼叫的第二用户;确定采集语音过程中获得的至少一种语音特征参数值,以及第一用户和第二用户的至少一种关系特征参数值;根据确定的至少一种语音特征参数值和确定的至少一种关系特征参数值,确定呼叫概率值;若呼叫概率值大于设定的第一阈值,则直接呼叫第二用户。由于通过语音识别用户要拨打的联系人后,可以根据用户语音拨号时语音的质量和用户与要拨打用户之间的关系等特征值确定用户要给被识别的联系人打电话的概率,在概率足够大时,可以直接拨打电话,无需通知用户确认。
-
公开(公告)号:CN104700843A
公开(公告)日:2015-06-10
申请号:CN201510060710.8
申请日:2015-02-05
Applicant: 海信集团有限公司
IPC: G10L25/48 , G10L15/02 , H04N21/439 , H04N21/466
Abstract: 本发明公开了一种年龄识别的方法及装置,包括:提取待识别声音信号中的浊音信息;对浊音信息进行特征提取,得到待识别声音信号的基频参数特征向量和梅尔频率倒谱系数特征向量;将基频参数特征向量与第一年龄识别模型进行匹配,将梅尔频率倒谱系数特征向量与第二年龄识别模型进行匹配,得到多个与年龄类别对应的第一年龄识别结果和第二年龄识别结果;将同一年龄类别对应的第一年龄识别结果和第二年龄识别结果进行加权计算,得到多个与年龄类别对应的第三年龄识别结果;将最大的第三年龄识别结果所对应的年龄类别作为待识别声音信号的年龄段识别结果提取出的基频参数和梅尔频率倒谱系数能更好地描述说话人的年龄特征,有利于提高年龄识别准确率。
-
公开(公告)号:CN108257602B
公开(公告)日:2021-06-01
申请号:CN201810087925.2
申请日:2018-01-30
Applicant: 海信集团有限公司
IPC: G10L15/26 , G10L15/14 , G10L15/30 , G06F40/232
Abstract: 本发明公开了一种车牌号字符串矫正方法、装置、服务器和终端,涉及语音识别领域。该车牌号字符串矫正方法包括:接收终端发送的语音数据,进行语音识别,得到语音数据对应的识别文本;基于预设的车牌号正则信息,在识别文本中提取出错误车牌号字符串;基于预先训练的车牌号的孤立词语音识别模型,对语音数据中与错误车牌号字符串对应的语音数据段,进行语音识别,得到语音数据段对应的正确车牌号字符串;将识别文本中的错误车牌号字符串替换为正确车牌号字符串,得到调整后的识别文本,将调整后的识别文本发送至终端。本申请达到了对识别错误的车牌号信息进行矫正,提高车牌号字符串识别的正确率的效果。
-
公开(公告)号:CN106847280B
公开(公告)日:2020-09-15
申请号:CN201710099111.6
申请日:2017-02-23
Applicant: 海信集团有限公司
IPC: G10L15/22 , G10L19/005
Abstract: 本发明公开了一种音频信息处理方法、智能终端及语音控制终端,属于终端技术领域。所述方法包括:接收语音控制终端发送的音频信息,所述音频信息包括至少两个语音压缩包和每个语音压缩包对应的语音压缩包标识;基于所述语音压缩包标识确定所述音频信息中是否丢失语音压缩包;当所述音频信息中丢失语音压缩包时,在丢失语音压缩包的位置处添加预设语音压缩包,得到优化音频信息;对所述优化音频信息进行语音识别。本发明可以在确定音频信息中丢失语音压缩包时,在丢失语音压缩包的位置处添加预设语音压缩包,然后进行对音频信息的语音识别,从而提高了智能终端对音频信息进行语音识别的正确率。
-
公开(公告)号:CN106504742B
公开(公告)日:2019-09-20
申请号:CN201610999015.2
申请日:2016-11-14
Applicant: 海信集团有限公司
Abstract: 本公开涉及了一种合成语音的传输方法、云端服务器和终端设备。所述合成语音的传输方法,包括:接收待合成的文本信息;对所述文本信息进行分词处理,得到至少一个语义单元;判断所述文本信息对应的合成语音的数据长度是否大于预设数据传输长度;若为是,则根据所述预设数据传输长度和语义单元,将所述文本信息对应的合成语音划分为至少两个待传输语音片段,所述待传输语音片段是若干个语义单元对应的合成语音;发送所述待传输语音片段。由于待传输语音片段是由若干个语义单元对应的合成语音组成的,因此,无论网络环境是否异常,该待传输的语音段都将保持文本信息原有的语义结构,从而保证了经传输的合成语音的可理解性。
-
公开(公告)号:CN105847252B
公开(公告)日:2019-07-12
申请号:CN201610165902.X
申请日:2016-03-22
Applicant: 海信集团有限公司
Abstract: 本发明公开了一种多账户切换的方法及装置,用于解决多个账户的情况下,如何更加便捷的进行账户间的切换是目前需要解决的问题,包括:在第一账户登录智能设备后,所述智能设备在设定时间间隔内接收到第二账户对应的用户的语音信号,且所述智能设备确定在所述时间间隔内未接收到所述第一账户对应的用户的语音信号;所述智能设备切换至所述第二账户。由于智能设备通过分析设定时间间隔内接收到的语音信号,在确定出在设定时间间隔内接收到了第二账户对应的用户的语音信号,且未接收到已登录的第一账户对应的用户的语音信号时,切换至第二账户,从而实现了多账户之间的切换,提高了用户体验。
-
公开(公告)号:CN106847280A
公开(公告)日:2017-06-13
申请号:CN201710099111.6
申请日:2017-02-23
Applicant: 海信集团有限公司
IPC: G10L15/22 , G10L19/005
CPC classification number: G10L19/005 , G10L15/22 , G10L2015/223
Abstract: 本发明公开了一种音频信息处理方法、智能终端及语音控制终端,属于终端技术领域。所述方法包括:接收语音控制终端发送的音频信息,所述音频信息包括至少两个语音压缩包和每个语音压缩包对应的语音压缩包标识;基于所述语音压缩包标识确定所述音频信息中是否丢失语音压缩包;当所述音频信息中丢失语音压缩包时,在丢失语音压缩包的位置处添加预设语音压缩包,得到优化音频信息;对所述优化音频信息进行语音识别。本发明可以在确定音频信息中丢失语音压缩包时,在丢失语音压缩包的位置处添加预设语音压缩包,然后进行对音频信息的语音识别,从而提高了智能终端对音频信息进行语音识别的正确率。
-
公开(公告)号:CN103943104A
公开(公告)日:2014-07-23
申请号:CN201410151266.6
申请日:2014-04-15
Applicant: 海信集团有限公司
Abstract: 本发明涉及信息识别领域,尤其涉及一种语音信息识别的方法及终端设备,以解决现有技术中存在当待识别语音信息的声音来源不稳定,或声音传输设备产生干扰时,确定的特征信息容易出现偏差的问题。本发明实施例采用从待识别语音信息中提取浊音信息,从浊音信息中提取基音频率参数和MFCC,对基音频率参数进行处理获得基音频率参数匹配值;对MFCC进行处理获得获得MFCC参数匹配值;根据基音频率参数匹配值及MFCC参数匹配值确定待识别语音信息的特征信息。由于语音信息中的浊音具有语音基音的周期性;并且浊音信息一般有相对固定的频率,其特性可以看作是一个准稳态过程,因此根据浊音信息确定的语音信息的特征信息出现差错的概率较低。
-
公开(公告)号:CN105721651B
公开(公告)日:2018-10-26
申请号:CN201610034405.6
申请日:2016-01-19
Applicant: 海信集团有限公司
IPC: H04M1/27
Abstract: 本发明公开了一种语音拨号方法和设备,涉及无线通信技术领域,用以解决语音拨号需要用户确认,效率比较低问题。本发明实施例根据采集的第一用户的语音,确定需要呼叫的第二用户;确定采集语音过程中获得的至少一种语音特征参数值,以及第一用户和第二用户的至少一种关系特征参数值;根据确定的至少一种语音特征参数值和确定的至少一种关系特征参数值,确定呼叫概率值;若呼叫概率值大于设定的第一阈值,则直接呼叫第二用户。由于通过语音识别用户要拨打的联系人后,可以根据用户语音拨号时语音的质量和用户与要拨打用户之间的关系等特征值确定用户要给被识别的联系人打电话的概率,在概率足够大时,可以直接拨打电话,无需通知用户确认。
-
-
-
-
-
-
-
-
-