-
公开(公告)号:CN114446288A
公开(公告)日:2022-05-06
申请号:CN202011116808.8
申请日:2020-10-19
Applicant: 阿里巴巴集团控股有限公司
Abstract: 公开了一种语音交互方法、装置及设备。对采集的音频数据进行语音活动检测;判断检测到的语音数据的时长是否大于第一阈值;若语音数据的时长小于或等于第一阈值,则不将语音数据交由语音识别系统进行语音识别。若基于语音活动检测得到的语音数据的时长小于第一阈值,则可以认为该语音数据为设备输出语音的回声数据(如残余回声),因此通过不将语音数据交由语音识别系统进行语音识别,可以避免因对设备输出语音的回声进行语音识别而对正常的语音交互产生干扰,提升语音交互服务质量。
-
公开(公告)号:CN109788398A
公开(公告)日:2019-05-21
申请号:CN201711107934.5
申请日:2017-11-10
Applicant: 阿里巴巴集团控股有限公司
IPC: H04R3/00
Abstract: 本发明提供了一种用于远场语音的拾音装置,包括:多路模拟声音接收器,用于将获取的声音信号转换为电信号;第一模数转换器,耦合至所述多路模拟声音接收器,用于将所述电信号转换为数字信号;接口控制器,耦合至所述模数转换器,用于将所述数字信号通过预设接口传送至控制设备。通过上述方案解决了现有的语音获取设备所存在的硬件成本高、性能无法保证的技术问题,达到了有效降低硬件成本和开发难度的技术效果。
-
公开(公告)号:CN113936678A
公开(公告)日:2022-01-14
申请号:CN202010607494.5
申请日:2020-06-29
Applicant: 阿里巴巴集团控股有限公司
IPC: G10L21/0208 , G10L15/22
Abstract: 本说明书一个或多个实施例提供一种目标语音的检测方法及装置、设备、存储介质。其中,该检测方法可以包括:当检测出获取到的原始音频数据中包含目标语音时,根据所述目标语音确定所述原始音频数据的噪声信息;基于所述噪声信息对所述原始音频数据进行语音增强处理,得到增强音频数据;检测所述增强音频数据中是否包含所述目标语音。
-
公开(公告)号:CN113837819A
公开(公告)日:2021-12-24
申请号:CN202010514453.1
申请日:2020-06-08
Applicant: 阿里巴巴集团控股有限公司
Abstract: 本申请实施例公开了信息处理设备、方法、装置及电子设备。所述方法包括:客户端获得不同用户类型信息各自关联的交互数据包,所述交互数据包中包括所述用户类型信息关联的商品对象的标识信息;如果获得售货机的声音采集模块采集的与消费者用户相关的声音信息,则根据从所述声音信息中提取的声纹特征确定所述消费者用户的目标用户类型信息;确定所述目标用户类型信息关联的目标交互数据包,获得所述目标交互数据包中包括的商品对象的相关信息,进行信息推送。如此方案,有助于在确保用户隐私安全性的情况下,向消费者用户提供个性化服务,提高用户使用体验。
-
公开(公告)号:CN113450497A
公开(公告)日:2021-09-28
申请号:CN202010219364.4
申请日:2020-03-25
Applicant: 阿里巴巴集团控股有限公司
IPC: G07F9/00 , G07F11/00 , G06F3/0484 , G06F3/0487 , G06F3/16 , G06F21/62
Abstract: 本申请实施例公开了信息处理方法、装置及电子设备。所述方法应用于售货机,所述售货机包括行人检测模块、声音采集模块、语音播报模块以及处理模块,所述方法包括:所述处理模块获得所述行人检测模块采集的人体感知信息时,通过所述语音播报模块对第一提示信息进行语音播报;如果获得所述声音采集模块采集的语音数据,则从所述语音数据中提取用户的操作指令信息;根据所述操作指令信息执行相关操作。如此方案,既有助于降低实现主动交互功能的成本,又有助于确保用户数据的安全性。
-
公开(公告)号:CN113393865A
公开(公告)日:2021-09-14
申请号:CN202010176807.6
申请日:2020-03-13
Applicant: 阿里巴巴集团控股有限公司
Abstract: 本申请实施例提供一种功耗控制、模式配置与VAD方法、设备及存储介质。在本申请实施例中,语音芯片或设备具备VAD功能,利用VAD功能可检测是否有语音信号输入,在检测到语音信号的情况下,语音芯片或设备从低功耗模式进入正常工作模式,可节约语音芯片或设备的功耗;进一步,语音芯片或设备同时具备硬件VAD功能和软件VAD功能,将硬件VAD功能与软件VAD功能组合使用可产生多种VAD模式,通过灵活配置语音芯片或设备所使用的VAD模式,可在一定程度上提高语音输入检测结果的准确度,降低误触发概率,提高语音芯片或设备的低功耗性能。
-
公开(公告)号:CN110837234A
公开(公告)日:2020-02-25
申请号:CN201810942566.4
申请日:2018-08-17
Applicant: 阿里巴巴集团控股有限公司
IPC: G05B19/042 , H01R13/66
Abstract: 本申请公开了一种智能语音控制面板及面板开关插座,智能语音控制面板至少包括:麦克风;以及,扬声器,设置在与麦克风之间距离大于预设第一安全距离的位置。利用本申请的智能语音控制面板,用户可以通过面板上的麦克风,向相关的智能控制对象发出指令,而在智能控制对象响应指令的过程中或者响应指令后,则可以通过面板上的扬声器给予回应,使得面板开关满足了人机交互需求,从而达到了更人性化的智能控制。
-
公开(公告)号:CN110874557B
公开(公告)日:2023-06-16
申请号:CN201811617671.7
申请日:2018-12-28
Applicant: 阿里巴巴集团控股有限公司
Abstract: 本申请公开了一种语音驱动虚拟人脸的视频生成方法以及装置,该方法包括:获得待输出的当前语音信息;根据预设的语音元素与面部驱动参数的映射关系,获得与当前语音信息包含的语音元素相对应的当前面部驱动参数;将当前面部驱动参数和预定的虚拟人脸面部模板结合,获得当前面部帧图;将当前面部帧图与预定的虚拟人脸面部模板进行贴合,获得对应于当前语音信息的当前面部视频帧。通过使用该方法,可利用任意语音信息驱动生成与之相对应的、与真实人物面部视频相同的虚拟人的面部视频,且该方法可适用于任意场景中,例如通过虚拟人进行交互的交互场景,简化了虚拟人面部视频的生成过程,增加了虚拟人的应用场景。
-
公开(公告)号:CN113393865B
公开(公告)日:2022-06-03
申请号:CN202010176807.6
申请日:2020-03-13
Applicant: 阿里巴巴集团控股有限公司
Abstract: 本申请实施例提供一种功耗控制、模式配置与VAD方法、设备及存储介质。在本申请实施例中,语音芯片或设备具备VAD功能,利用VAD功能可检测是否有语音信号输入,在检测到语音信号的情况下,语音芯片或设备从低功耗模式进入正常工作模式,可节约语音芯片或设备的功耗;进一步,语音芯片或设备同时具备硬件VAD功能和软件VAD功能,将硬件VAD功能与软件VAD功能组合使用可产生多种VAD模式,通过灵活配置语音芯片或设备所使用的VAD模式,可在一定程度上提高语音输入检测结果的准确度,降低误触发概率,提高语音芯片或设备的低功耗性能。
-
公开(公告)号:CN113496701A
公开(公告)日:2021-10-12
申请号:CN202010256834.4
申请日:2020-04-02
Applicant: 阿里巴巴集团控股有限公司
IPC: G10L15/22
Abstract: 提出了一种语音交互系统、设备、方法及其相应的会议系统。所述语音交互系统,包括多个相互通信的语音设备,其中,所述语音设备具有远场语音交互功能并且用于进行语音交互;其中,所述多个语音设备基于预定仲裁规则,选择其中的一个语音设备与用户进行当前语音交互。本发明的语音交互方案可以通过基于用户实时状态的多端仲裁实现多个语音设备的动态选择。具体地,可以通过就近应答等原则确定最适于与用户交互的设备,由此提升为用户提供语音服务的准确性和易用性。
-
-
-
-
-
-
-
-
-