利用语音唤醒执行语音识别的方法和装置

    公开(公告)号:CN113841196B

    公开(公告)日:2025-01-07

    申请号:CN202080037110.9

    申请日:2020-05-15

    Abstract: 一种语音识别方法,包括:接收第一多声道音频信号;针对与第一多声道音频信号中包括的声道音频信号对应的频带的至少一个频带,针对当前帧获取语音信号特性和噪声信号特性;通过基于语音信号特性、噪声信号特性以及在当前帧之前的特定时间段内针对先前帧获取的先前语音信号特性对第一多声道音频信号进行波束形成,从而生成具有经增强语音分量的信号;确定经增强语音分量是否包括唤醒词;以及基于确定出经增强语音分量包括唤醒词:基于具有经增强语音分量的信号启用语音识别操作。

    用于执行语音识别的电子装置及其控制方法

    公开(公告)号:CN119816891A

    公开(公告)日:2025-04-11

    申请号:CN202380063276.1

    申请日:2023-11-08

    Abstract: 这个电子装置包括一个或多个处理器,所述一个或多个处理器:在所述电子装置正在语音别模式下操作时,将与通过麦克风接收到的用户语音相对应的用户语音信号输入到语音识别模型中,以执行语音识别;根据语音识别的所述结果,获取在接收所述用户语音时所述电子装置附近的环境信息;将获取的环境信息存储在存储器中;在所述电子装置正在学习模式下操作时,基于存储在所述存储器中的多条环境信息中的所述环境信息,从多个外部装置中识别用于输出用户学习的用户语音的外部装置;控制通信接口,使得用于控制输出所述用于学习的用户语音的命令被发送到所述外部装置;以及,如果从所述麦克风接收到用于学习的用户语音信号,则在所述用于学习的用户语音信号上训练所述语音识别模型。

    电子装置及其控制方法
    4.
    发明授权

    公开(公告)号:CN111433737B

    公开(公告)日:2024-06-14

    申请号:CN201880078290.8

    申请日:2018-11-29

    Inventor: 刘钟旭 申錤埙

    Abstract: 公开了一种电子装置、其控制方法以及用于所述电子装置的计算机程序产品,所述电子装置包括:接收机,包括接收电路,所述接收电路被配置为接收声音;以及处理器,被配置为:基于通过所述接收机接收到声音,以给定的灵敏度识别接收到的声音的特性是否对应于用户的语音命令;基于接收到的声音的所述特性对应于所述语音命令来识别所述语音命令,并且执行与识别出的语音命令相对应的操作;以及基于接收到的声音的所述特性不对应于所述语音命令来改变所述灵敏度。因此,所述电子装置通过基于情况适当地控制所述灵敏度来执行最优和/或改进的音频处理。

    电子设备和控制电子设备的方法

    公开(公告)号:CN112867987B

    公开(公告)日:2024-05-31

    申请号:CN201980068526.4

    申请日:2019-10-11

    Abstract: 提供了一种能够通过用户界面提供对应于用户语音的文本信息的电子设备以及控制该电子设备的方法。具体地,根据本公开的电子设备,当获得包括至少一个对象的图像时,分析图像以识别包括在图像中的至少一个对象,并且当接收到用户语音时,对用户语音执行语音识别以获得对应于用户语音的文本信息,然后识别包括在图像中的至少一个对象当中的对应于用户语音的对象,并且在显示器上的区域当中的与被识别为对应于用户语音的对象相对应的区域上显示包括文本信息的备忘录用户界面(UI)。

    电子装置及其控制方法
    7.
    发明公开

    公开(公告)号:CN111433737A

    公开(公告)日:2020-07-17

    申请号:CN201880078290.8

    申请日:2018-11-29

    Inventor: 刘钟旭 申錤埙

    Abstract: 公开了一种电子装置、其控制方法以及用于所述电子装置的计算机程序产品,所述电子装置包括:接收机,包括接收电路,所述接收电路被配置为接收声音;以及处理器,被配置为:基于通过所述接收机接收到声音,以给定的灵敏度识别接收到的声音的特性是否对应于用户的语音命令;基于接收到的声音的所述特性对应于所述语音命令来识别所述语音命令,并且执行与识别出的语音命令相对应的操作;以及基于接收到的声音的所述特性不对应于所述语音命令来改变所述灵敏度。因此,所述电子装置通过基于情况适当地控制所述灵敏度来执行最优和/或改进的音频处理。

    利用语音唤醒执行语音识别的方法和装置

    公开(公告)号:CN113841196A

    公开(公告)日:2021-12-24

    申请号:CN202080037110.9

    申请日:2020-05-15

    Abstract: 一种语音识别方法,包括:接收第一多声道音频信号;针对与第一多声道音频信号中包括的声道音频信号对应的频带的至少一个频带,获取语音信号特性或噪声信号特性中的至少一个;通过基于语音信号特性、噪声信号特性以及在获取第一多声道音频信号的特定时间之前获取的且针对先前帧获取的语音信号特性对第一多声道音频信号进行波束形成,从而生成具有经增强语音分量的信号;确定经增强语音分量是否包括唤醒词;以及基于确定出经增强语音分量包括唤醒词:基于具有经增强语音分量的信号启用语音识别操作。

    电子设备和控制电子设备的方法

    公开(公告)号:CN112867987A

    公开(公告)日:2021-05-28

    申请号:CN201980068526.4

    申请日:2019-10-11

    Abstract: 提供了一种能够通过用户界面提供对应于用户语音的文本信息的电子设备以及控制该电子设备的方法。具体地,根据本公开的电子设备,当获得包括至少一个对象的图像时,分析图像以识别包括在图像中的至少一个对象,并且当接收到用户语音时,对用户语音执行语音识别以获得对应于用户语音的文本信息,然后识别包括在图像中的至少一个对象当中的对应于用户语音的对象,并且在显示器上的区域当中的与被识别为对应于用户语音的对象相对应的区域上显示包括文本信息的备忘录用户界面(UI)。

Patent Agency Ranking