-
公开(公告)号:CN109686362A
公开(公告)日:2019-04-26
申请号:CN201910002527.0
申请日:2019-01-02
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 赵涛涛
CPC classification number: G10L15/005 , G10L15/1822 , G10L15/22 , G10L25/54 , G10L2015/225
Abstract: 本发明实施例提供了一种语音播报方法、装置和计算机可读存储介质,其中所述方法包括:对输入语音进行口音识别,得到所述输入语音的口音级别,其中,所述口音级别表示一种口音相对于目标语言的口音的相似程度;利用所述输入语音的口音级别确定播报方式;利用所述播报语音的播报方式输出播报语音。本发明的一个实施例能够使智能音箱的语音交互更加个性化,从而提升用户的体验;本发明的另一个实施例利用接收到所述输入语音的装置的所在位置确定地区信息;利用所述地区信息对所述输入语音的口音级别进行校准,从而使确定口音级别更为准确。
-
公开(公告)号:CN109065041A
公开(公告)日:2018-12-21
申请号:CN201810903913.2
申请日:2018-08-09
Applicant: 上海常仁信息科技有限公司
IPC: G10L15/22 , G10L15/00 , G10L15/26 , G10L15/30 , G10L21/0208 , G06F21/32 , G06F17/30 , G06F17/28
CPC classification number: G10L15/22 , G06F17/2881 , G06F21/32 , G10L15/005 , G10L15/265 , G10L15/30 , G10L21/0208 , G10L2015/225
Abstract: 本发明公开了一种基于机器人的语音交互系统,包括机器人本体和云服务器,所述机器人本体通过网络与云服务器进行数据信息的传递,所述机器人本体包括开关模块、声音处理模块、语音识别模块、检索模块、语音输出模块和外部模块,所述云服务器包括语音问答知识库和文字问答知识库,所述语音问答知识库用于储存语音问答类问题和答案,所述文字问答知识库用于储存文字类问题和答案,所述开关模块包括开关键和指纹登录单元,所述开关键用于对机器人本体进行开关,避免不使用时待机费电。该基于机器人的语音交互系统和方法,不仅能够使用在不同的环境中,还能适合不同的人群,适用范围极广,适合大范围的普及和推广。
-
公开(公告)号:CN108885871A
公开(公告)日:2018-11-23
申请号:CN201680077392.9
申请日:2016-10-04
Applicant: 通用电气公司
CPC classification number: G10L17/22 , G10L15/005 , G10L15/1822 , G10L15/22 , G10L17/00 , G10L21/028 , G10L25/93 , G10L2015/223 , H04R3/005
Abstract: 提供了一种系统,其中执行协调处理的用户被定位在基于音频输入的复杂环境中。基于系统用户发声来检测和执行音频命令。可用命令受用户状态、位置、处理类型和处理进度的限制。命令执行受系统用户、非用户或无关设备的存在和位置的限制。
-
公开(公告)号:CN108710616A
公开(公告)日:2018-10-26
申请号:CN201810503163.X
申请日:2018-05-23
Applicant: 科大讯飞股份有限公司
CPC classification number: G06F17/2809 , G10L15/005 , G10L15/265
Abstract: 本申请公开了一种语音翻译方法及装置,所述方法包括:对用户的源语音数据进行翻译,得到第一翻译文本,该第一翻译文本的语种与源语音数据的语种不同,然后,通过与用户进行交互,判断第一翻译文本作为源语音数据的翻译结果是否正确。可见,本申请通过对第一翻译文本作为源语音数据的翻译结果是否正确进行判断,可以基于判断结果对第一翻译文本进行处理,从而可以提高翻译结果的准确性。
-
公开(公告)号:CN107945806A
公开(公告)日:2018-04-20
申请号:CN201711106112.5
申请日:2017-11-10
Applicant: 北京小米移动软件有限公司
CPC classification number: G10L17/005 , G10L13/08 , G10L15/005 , G10L15/22 , G10L17/02
Abstract: 本公开是关于一种基于声音特征的用户识别方法及装置。所述方法包括:从获取的语音中提取声学特征;获取与所述声学特征匹配的用户信息;在获取到所述匹配的用户信息时,输出所述用户信息。本公开技术方案通过在接收到将一段文本内容以与一个已输入语音的用户匹配的声学特征播放的操作命令时,获取与已输入语音的用户对应的声学子特征,并基于已输入语音的用户对应的声学子特征,可实现以与已输入语音的用户匹配的声学特征播放该文本内容匹配的语音。
-
公开(公告)号:CN107909994A
公开(公告)日:2018-04-13
申请号:CN201711046127.7
申请日:2017-10-31
Applicant: 珠海市魅族科技有限公司
Inventor: 胡交
CPC classification number: G10L15/005 , G06F3/04817 , G06F17/289 , G10L15/26 , G10L25/51 , H04M1/7255 , H04M1/72563
Abstract: 本发明提供一种通信控制方法,所述通信控制方法包括:采集终端在通话过程中通话联系人的第一语音数据,判断所述第一语音数据是否与所述终端用户的第二语音数据相匹配,若判断结果为否,则在所述终端的当前显示界面上显示预设图标,若接收到对所述预设图标的选取操作,则开启与所述预设图标相对应的预设翻译应用,将采集到的所述第一语音数据通过所述预设翻译应用进行翻译,并获取与所述第一语音数据相应的文字,在所述终端的当前显示界面上显示所述文字。本发明还提供一种通信控制装置、计算机装置及计算机可读存储介质。本发明能够方便于语言不同的人在通话时的沟通。
-
公开(公告)号:CN107885731A
公开(公告)日:2018-04-06
申请号:CN201711078885.7
申请日:2017-11-06
Applicant: 深圳市沃特沃德股份有限公司
CPC classification number: G06F17/289 , G10L15/005 , G10L15/26
Abstract: 本发明揭示了一种语音翻译方法和装置,所述方法包括以下步骤:与第一蓝牙耳机建立连接;接收第一蓝牙耳机发送的语音信息,并对语音信息进行翻译处理;断开与第一蓝牙耳机的连接,并与第二蓝牙耳机建立连接;将翻译处理后的语音信息发送给第二蓝牙耳机。从而,利用翻译机的半双工交互特点,通过翻译机在两个蓝牙耳机之间的分时切换连接,实现了翻译机与两个蓝牙耳机的分时通信,达到了不同语言的语音互译的目的。本发明实施例只需两个普通的蓝牙耳机与翻译机配合就能实现语音翻译,无需将普通的蓝牙耳机改进为专门的蓝牙翻译耳机,既降低了实现成本又扩展了应用范围,并降低了用户的使用成本,提升了用户体验。
-
公开(公告)号:CN107845382A
公开(公告)日:2018-03-27
申请号:CN201711049271.6
申请日:2013-06-18
Applicant: 谷歌有限责任公司
Inventor: 佩德罗·J·莫雷诺·门希瓦尔 , 迈克尔·H·科恩
IPC: G10L15/197 , G06F17/30 , G10L15/22
CPC classification number: G06F17/30696 , G06F17/30241 , G06F17/30292 , G06F17/30684 , G06F17/30687 , G10L15/005 , G10L15/14 , G10L15/197 , G10L15/24 , G10L15/26 , G10L15/265 , G10L2015/0633 , G10L2015/081 , G10L2015/228
Abstract: 本申请涉及动态语言模型。用于语音识别的方法、系统和设备,包括在计算机存储介质上编码的计算机程序。其中一种方法包括:接收用于语音识别的基本语言模型,基本语言模型包括具有基本概率值的第一词语序列;接收与查询场境相关联的话音搜索查询;当查询场境满足与定制语言模型相关联的一个或多个准则时,确定要使用定制语言模型;获得定制语言模型,定制语言模型包括具有经过调节的概率值的第一词语序列,经过调节的概率值是基本概率值被根据查询场境来调节的;以及基于一个或多个概率,将话音搜索查询转换为文本搜索查询,每个概率对应于一个或多个词语序列的群组中的词语序列,群组包括具有经过调节的概率值的第一词语序列。
-
公开(公告)号:CN107590136A
公开(公告)日:2018-01-16
申请号:CN201710319929.4
申请日:2017-05-09
Applicant: 富士施乐株式会社
Inventor: 伊藤泰
IPC: G06F17/28
CPC classification number: G06F17/289 , G06F17/2827 , G06F17/2836 , G06K9/00449 , G06K9/2063 , G06K2209/011 , G10L15/005
Abstract: 翻译设备、翻译系统以及翻译方法。翻译设备包括翻译单元、历史创建单元、提取单元和组合单元。翻译单元将原稿内容翻译成不同语言。当翻译单元将原稿内容从第一语言翻译成第二语言时,历史创建单元创建包括第一语言的原文与第二语言的译文之间的对应性的历史信息。当翻译单元要将原稿内容从第二语言翻译成另一种语言时,如果以第二语言记载的原稿内容存在于历史信息中,则提取单元提取不存在于历史信息中的内容。组合单元将翻译结果与替换结果组合。翻译结果通过由翻译单元翻译不存在于历史信息中的内容获得。翻译从第二语言到另一种语言执行。替换结果通过替换存在于历史信息中的内容获得。替换基于历史信息从第二语言到另一种语言执行。
-
公开(公告)号:CN107315560A
公开(公告)日:2017-11-03
申请号:CN201710418893.5
申请日:2017-06-06
Applicant: 南通米高电子科技有限公司
Inventor: 孙佳慧
IPC: G06F3/16 , G06F9/44 , G06F3/0484 , G10L15/00 , G10L15/26
CPC classification number: G06F3/167 , G06F3/0484 , G06F2203/04806 , G10L15/005 , G10L15/26
Abstract: 一种语言转换及控制系统,其中,该方法包括如下步骤:与语言转换及控制系统载体建立连接,初始时将语言信号接收芯片置为语言接收转换装置,将语言转换及控制系统载体置为语言转换结果显示装置;将语言转换结果显示装置的桌面图像信息缩放;将缩放后的语言转换结果显示装置的桌面图像信息与语言接收转换装置的桌面图像信息进行叠加,使得语言转换结果显示装置桌面显示于语言接收转换装置桌面的一位置;显示上述叠加后的图像信息于显示装置;及响应操作产生相应操作命令对语言信号接收芯片或语言转换及控制系统载体进行控制。本发明可实现显示快速准确的识别人类语言,并完成其交流或查询的目的。
-
-
-
-
-
-
-
-
-