-
公开(公告)号:CN118645113B
公开(公告)日:2024-10-29
申请号:CN202411110746.8
申请日:2024-08-14
Applicant: 腾讯科技(深圳)有限公司
IPC: G10L21/0232 , G10L21/0224 , H04M9/08
Abstract: 本申请提供了一种语音信号处理方法、装置、设备、介质及产品,该方法包括:获取语音交互过程产生的混合语音信号,该混合语音信号包含:在近端产生的第一语音信号、近端所在的环境噪声信号、以及远端回声信号;基于混合语音信号,确定待处理的目标频谱,该目标频谱包括第一信号频谱、第二信号频谱和第三信号频谱;采用多级语音优化网络对目标频谱进行多级优化处理,得到优化频谱;优化处理包括回声消除处理与噪声抑制处理;对优化频谱进行时频转换处理,得到混合语音信号对应的优化语音信号。本申请能够在频域上对语音信号进行多级优化处理,以提高噪声抑制和回声消除的效果。
-
公开(公告)号:CN114338623A
公开(公告)日:2022-04-12
申请号:CN202210007064.9
申请日:2022-01-05
Applicant: 腾讯科技(深圳)有限公司
IPC: H04L65/60 , G10L21/0208 , G10L21/0316 , G10L25/24 , G10L25/30 , G10L25/78
Abstract: 本申请公开了一种音频的处理方法、装置、设备、介质及计算机程序产品,涉及音频处理领域。该方法包括:获取音频数据对应的音频特征,音频数据为待进行语音传输的音频,音频特征用于指示音频数据的能量分布情况;基于音频特征对音频数据进行噪声抑制处理,得到降噪音频数据;基于音频特征对应的能量分布情况确定语音检测数据,语音检测数据用于指示音频数据中语音信号的存在情况;根据语音检测数据对降噪音频数据进行音量缩放处理,得到目标音频数据,目标音频数据为用于进行语音传输的音频。根据音频特征对应的能量分布确定该音频数据中是否包含语音信号后,对降噪后的音频数据进行音量调整,提升了音频数据在音量调整过程中的增益效果。
-
公开(公告)号:CN117373469A
公开(公告)日:2024-01-09
申请号:CN202210778876.3
申请日:2022-06-30
Applicant: 腾讯科技(深圳)有限公司
IPC: G10L21/0208 , G10L25/03
Abstract: 本申请公开了一种回声信号消除方法、装置、电子设备及可读存储介质,属于多媒体信息处理技术领域。方法包括:对第一设备的第一音频信号和第二设备的第二音频信号进行特征提取,分别得到第一音频特征和第二音频特征;基于第一音频特征和第二音频特征,确定第一音频信号和第二音频信号之间的相似度;当该相似度大于相似度阈值时,将第一音频信号作为回声信号进行消除。由于当该相似度大于相似度阈值时,能表明第一音频信号和第二音频信号对应同一个声音,因此,通过消除作为回声信号的第一音频信号,可以避免回声现象的产生。
-
公开(公告)号:CN117219107A
公开(公告)日:2023-12-12
申请号:CN202311480839.5
申请日:2023-11-08
Applicant: 腾讯科技(深圳)有限公司
IPC: G10L21/0208 , G10L21/0264 , G10L21/0232 , G10L25/30 , H04M9/08
Abstract: 本申请提供了一种回声消除模型的训练方法、装置及计算机可读存储介质;方法包括:获取语音样本,其中,语音样本包括远端语音信号、回音消除语音信号和传感器信号;通过远端语音信号、回音消除语音信号和传感器信号调用回声消除模型,得到预测频谱;确定目标频谱和预测频谱对应第一均方误差损失函数的第一均方误差损失值,并确定对应第二均方误差损失函数的第二均方误差损失值;确定第一均方误差损失值和第二均方误差损失值的组合损失值;根据组合损失值更新回声消除模型的参数,基于更新的参数生成训练后的回声消除模型。通过本申请,能够使回声消除模型在训练过程中快速收敛并提升回声消除模型的泛化能力。
-
公开(公告)号:CN116566963A
公开(公告)日:2023-08-08
申请号:CN202310850039.1
申请日:2023-07-12
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请涉及多媒体技术领域,尤其涉及一种音频处理方法、装置、电子设备和存储介质,用以降低音频处理的资源耗费。其中,方法包括:基于承载应用程序的终端设备的配置信息,获得各初始音频信号各自对应的处理模式;分别基于各初始音频信号各自的处理模式,对初始音频信号进行处理,获得各目标音频信号,其中,输入音频信号经处理后,获得的目标音频信号为采集音频信号,输出音频信号经处理后获得的目标音频信号为共享音频信号;对各目标音频信号进行混音,并对混音后音频进行编码,获得待发送编码信号。本申请通过基于配置信息获得初始音频信号的处理模式,实现不同终端设备之间的音频共享,对处理后的音频信号混音后编码,节省计算资源。
-
公开(公告)号:CN117992599B
公开(公告)日:2024-07-09
申请号:CN202410409687.8
申请日:2024-04-07
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/335 , G06F16/338
Abstract: 本申请提供了一种基于大语言模型的问答方法、装置及计算机设备,属于人工智能技术领域。所述方法包括:基于多个第一问题获取多个第二问题,采用不同的召回方式,分别获取每个第二问题的多个第一提示文本和多个第二提示文本。不同的召回方式具有不同的召回效果,从不同召回效果下的多个提示文本中,基于每个提示文本与第一问题之间的相关度,获取该第一问题的参考文本,能够获取到更加准确且与第一问题更加相关的参考文本。调用大语言模型对该准确性和相关性更高的参考文本进行处理,以得到第一问题的答案,能够提高大语言模型的准确性,从而使大语言模型输出的答案与第一问题更加相关。
-
公开(公告)号:CN117992599A
公开(公告)日:2024-05-07
申请号:CN202410409687.8
申请日:2024-04-07
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/335 , G06F16/338
Abstract: 本申请提供了一种基于大语言模型的问答方法、装置及计算机设备,属于人工智能技术领域。所述方法包括:基于多个第一问题获取多个第二问题,采用不同的召回方式,分别获取每个第二问题的多个第一提示文本和多个第二提示文本。不同的召回方式具有不同的召回效果,从不同召回效果下的多个提示文本中,基于每个提示文本与第一问题之间的相关度,获取该第一问题的参考文本,能够获取到更加准确且与第一问题更加相关的参考文本。调用大语言模型对该准确性和相关性更高的参考文本进行处理,以得到第一问题的答案,能够提高大语言模型的准确性,从而使大语言模型输出的答案与第一问题更加相关。
-
公开(公告)号:CN116566963B
公开(公告)日:2023-10-13
申请号:CN202310850039.1
申请日:2023-07-12
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请涉及多媒体技术领域,尤其涉及一种音频处理方法、装置、电子设备和存储介质,用以降低音频处理的资源耗费。其中,方法包括:基于承载应用程序的终端设备的配置信息,获得各初始音频信号各自对应的处理模式;分别基于各初始音频信号各自的处理模式,对初始音频信号进行处理,获得各目标音频信号,其中,输入音频信号经处理后,获得的目标音频信号为采集音频信号,输出音频信号经处理后获得的目标音频信号为共享音频信号;对各目标音频信号进行混音,并对混音后音频进行编码,获得待发送编码信号。本申请通过基于配置信息获得初始音频信号的处理模式,实现不同终端设备之间的音频共享,对处理后的音频信号混音后编码,节省计算资源。
-
公开(公告)号:CN117219107B
公开(公告)日:2024-01-30
申请号:CN202311480839.5
申请日:2023-11-08
Applicant: 腾讯科技(深圳)有限公司
IPC: G10L21/0208 , G10L21/0264 , G10L21/0232 , G10L25/30 , H04M9/08
Abstract: 本申请提供了一种回声消除模型的训练方法、装置及计算机可读存储介质;方法包括:获取语音样本,其中,语音样本包括远端语音信号、回音消除语音信号和传感器信号;通过远端语音信号、回音消除语音信号和传感器信号调用回声消除模型,得到预测频谱;确定目标频谱和预测频谱对应第一均方误差损失函数的第一均方误差损失值,并确定对应第二均方误差损失函数的第二均方误差损失值;确定第一均方误差损失值和第二均方误差损失值的组合损失值;根据组合损失值更新回声消除模型的参数,基于更新的参数生成训练后的回声消除模型。通过本申请,能够使回声消除模型在训练过程中快速收敛并提升回声消除模型的泛化能力。
-
公开(公告)号:CN114338623B
公开(公告)日:2023-12-05
申请号:CN202210007064.9
申请日:2022-01-05
Applicant: 腾讯科技(深圳)有限公司
IPC: H04L65/60 , G10L21/0208 , G10L21/0316 , G10L25/24 , G10L25/30 , G10L25/78
Abstract: 本申请公开了一种音频的处理方法、装置、设备及介质,涉及音频处理领域。该方法包括:获取音频数据对应的音频特征,音频数据为待进行语音传输的音频,音频特征用于指示音频数据的能量分布情况;基于音频特征对音频数据进行噪声抑制处理,得到降噪音频数据;基于音频特征对应的能量分布情况确定语音检测数据,语音检测数据用于指示音频数据中语音信号的存在情况;根据语音检测数据对降噪音频数据进行音量缩放处理,得到目标音频数据,目标音频数据为用于进行语音传输的音频。根据音频特征对应的能量分布确定该音频数据中是否包含语音信号后,对降噪后的音频数据进行音量调整,提升了音频数据在音量调整过程中的增益效果。
-
-
-
-
-
-
-
-
-