语音处理方法、装置、电子设备及存储介质

    公开(公告)号:CN118629426A

    公开(公告)日:2024-09-10

    申请号:CN202410617267.9

    申请日:2024-05-17

    Abstract: 本申请公开了一种语音处理方法、装置、电子设备及存储介质,涉及声纹鉴定技术领域。该方法包括:获取待处理的目标语音;提取目标语音的声纹特征,作为目标声纹特征,目标声纹特征包括目标语音对应的目标图谱特征,以及目标语音中所有相邻音节之间的目标过渡特征;对目标声纹特征与样本声纹特征进行匹配,以基于匹配结果进行身份匹配识别,样本声纹特征包括样本语音对应的样本图谱特征,以及样本语音中所有相邻音节之间的样本过渡特征。如此,由于目标声纹特征不仅包括图谱特征,还包括相邻音节之间的过渡特征,过渡特征能够更准确地反映个体语音的特性,从而进一步提高声纹身份验证的准确性和稳定性。

    语音增强方法、装置、电子设备及计算机可读存储介质

    公开(公告)号:CN117854526B

    公开(公告)日:2024-05-24

    申请号:CN202410264048.7

    申请日:2024-03-08

    Abstract: 本申请公开了一种语音增强方法、装置、电子设备及计算机可读存储介质,应用于包括M个语音采集设备的语音增强系统中的电子设备,包括:获取M个语音采集设备中N个语音采集设备采集的语音信息,根据语音信息和N个语音采集设备确定K个用户、K个声纹和K个语音采集设备组,若K个语音采集设备组中存在语音采集设备的数量大于1的语音采集设备组,则根据L个声纹和L个语音采集设备组确定L个用户的目标语音采集设备阵列,根据L个声纹和目标语音采集设备阵列中每个语音采集设备的位置,对目标语音采集设备阵列采集的语音信息进行多通道语音增强,得到L个用户的目标语音信息。本申请实施例中,进行了多通道语音增强,可以提高语音增强的效果。

    降噪方法、装置、可穿戴设备及存储介质

    公开(公告)号:CN118038840A

    公开(公告)日:2024-05-14

    申请号:CN202311867548.1

    申请日:2023-12-29

    Abstract: 本申请实施例公开了一种降噪方法、装置、可穿戴设备及存储介质。所述方法包括:获取待处理音频以及佩戴者的身体信号,所述待处理音频包括环境音频和佩戴者音频;基于所述环境音频,确定所述待处理音频对应的降噪算法;基于所述身体信号,确定所述待处理音频对应的调整系数;基于所述降噪算法和所述调整系数,对所述待处理音频进行降噪处理,得到目标音频。通过上述方法,可以根据佩戴者的身体信号来确定调整系数,从而可以结合调整系数以及环境音频对应的降噪算法来动态的对待处理音频进行降噪处理,满足了不同的降噪需求。

    语音增强方法、装置、电子设备及计算机可读存储介质

    公开(公告)号:CN117854526A

    公开(公告)日:2024-04-09

    申请号:CN202410264048.7

    申请日:2024-03-08

    Abstract: 本申请公开了一种语音增强方法、装置、电子设备及计算机可读存储介质,应用于包括M个语音采集设备的语音增强系统中的电子设备,包括:获取M个语音采集设备中N个语音采集设备采集的语音信息,根据语音信息和N个语音采集设备确定K个用户、K个声纹和K个语音采集设备组,若K个语音采集设备组中存在语音采集设备的数量大于1的语音采集设备组,则根据L个声纹和L个语音采集设备组确定L个用户的目标语音采集设备阵列,根据L个声纹和目标语音采集设备阵列中每个语音采集设备的位置,对目标语音采集设备阵列采集的语音信息进行多通道语音增强,得到L个用户的目标语音信息。本申请实施例中,进行了多通道语音增强,可以提高语音增强的效果。

    语音数据压缩方法、装置、电子设备及可读存储介质

    公开(公告)号:CN117292697A

    公开(公告)日:2023-12-26

    申请号:CN202311133325.2

    申请日:2023-09-01

    Abstract: 本申请公开了一种语音数据压缩方法、装置、电子设备及可读存储介质,应用于语音通信系统的发送端,语音通信系统还包括接收端,方法包括:获取语音通信场景下的待压缩语音数据;基于待压缩语音数据的音素,获取音素对应的第一序列;基于指定音频内容,减少第一序列的数据量,得到第二序列,指定音频内容包括待压缩语音数据中的噪音内容和静音内容的至少一种;获取待压缩语音数据的声纹特征,确定声纹特征对应的第三序列;发送第二序列以及第三序列至接收端,以指示接收端对第二序列以及第三序列进行合成,得到目标语音数据。通过对噪音内容或静音内容的数据量的进一步减少,在提升待压缩语音数据压缩率的同时,还可以几乎不降低音质。

    关键词的命中确定方法、装置、电子设备及存储介质

    公开(公告)号:CN117010375A

    公开(公告)日:2023-11-07

    申请号:CN202310786067.1

    申请日:2023-06-29

    Abstract: 本申请公开了一种基于关键词的命中确定方法、装置、电子设备及存储介质该方法包括:获取待检测段落,并对所述待检测段落进行分词处理得到多个关键词;确定所述多个关键词各自对应的词性,并基于所述多个关键词各自对应的词性在所述多个关键词中确定定位关键词;根据所述定位关键词在待检测文本中进行查找,确定所述定位关键词在所述待检测文本中的位置;根据所述位置和所述多个关键词,在所述待检测文本中确定与所述多个关键词对应的命中信息。本申请通过确定定位关键词并通过定位关键词在待检测文本中的位置来确定命中信息,提高命中信息的确定范围,使得命中信息更加准确和全面。

    语音数据生成方法、装置、电子设备及可读存储介质

    公开(公告)号:CN116844523A

    公开(公告)日:2023-10-03

    申请号:CN202311115711.9

    申请日:2023-08-31

    Abstract: 本申请公开了一种语音数据生成方法、装置、电子设备及可读存储介质,涉及数据技术领域,应用于电子设备,所述方法包括:获取第一语种的初始语音数据,所述初始语音数据中包括至少一条语音数据;从所述初始语音数据中选择满足指定条件的部分语音数据作为指定语音数据;将所述指定语音数据转换为第二语种的目标语音数据;将所述目标语音数据作为所述第二语种的语音模型的样本数据。可以通过获取第一语种的初始语音数据,将该初始语音数据转换为第二语种的目标语音数据,从而将目标语音数据作为第二语种的语音模型的样本数据,可以较为简单的满足第二语种的语音模型对样本数据的数量的需求。

    声纹识别方法、装置、电子设备及计算机可读存储介质

    公开(公告)号:CN116825114A

    公开(公告)日:2023-09-29

    申请号:CN202311115669.0

    申请日:2023-08-31

    Abstract: 本申请公开了一种声纹识别方法、装置、电子设备及计算机可读存储介质,涉及人工智能技术领域,该方法包括:获取语音特征,通过目标时延神经网络的帧级别层对语音特征逐帧进行抽象压缩,得到T帧帧特征,T为大于或等于1的整数,通过目标时延神经网络的池化层对T帧帧特征进行汇聚得到段特征,池化层包括多头注意力单元,多头注意力单元用于为T帧帧特征确定权重,通过目标时延神经网络的段级别层对段特征进行抽象压缩,得到语音特征对应的声纹特征。本申请实施例中,在对语音特征进行识别之后,能够提升声纹识别的精度。

    语音识别方法、装置、电子设备及存储介质

    公开(公告)号:CN113643706B

    公开(公告)日:2023-09-26

    申请号:CN202110796768.4

    申请日:2021-07-14

    Abstract: 本申请实施例公开了一种语音识别方法、装置、电子设备及存储介质。所述方法包括:获取待识别语音数据;对所述待识别语音数据进行识别,获取与所述待识别语音数据对应的第一语音识别结果以及所述第一语音识别结果对应的损失;从所述第一语音识别结果中获取关键词;基于所述关键词,调整所述第一语音识别结果对应的损失,以得到调整损失后的第一语音识别结果;从所述调整损失后的第一语音识别结果中获取所述待识别语音数据对应的第二语音识别结果。通过上述方法,根据关键词对第一语音识别结果的损失进行调整,再从调整损失后的第一语音识别结果中获取待识别语音数据对应的第二语音识别结果,提高了对待识别语音数据识别的准确率。

Patent Agency Ranking