音频丢包补偿模型的训练方法、装置和计算机设备

    公开(公告)号:CN119517047A

    公开(公告)日:2025-02-25

    申请号:CN202311062213.2

    申请日:2023-08-22

    Inventor: 吕俊领

    Abstract: 本申请涉及一种音频丢包补偿模型的训练方法、装置、计算机设备、存储介质和计算机程序产品。音频丢包补偿模型的训练方法包括:基于音频训练集对原始生成对抗网络进行迭代训练,得到了训练好的生成对抗网络,并明确了生成器中与生成丢包帧的补偿信号有关的计算,根据生成器中与生成丢包帧的补偿信号有关的计算对生成对抗网络的生成器进行重构,得到音频丢包补偿模型。由于音频丢包补偿模型是基于生成器中与生成丢包帧的补偿信号有关的计算重构得到,使得音频丢包补偿模型在生成丢包帧的补偿信号时只需要进行与生成补偿信号有关的计算,减少了无关计算的计算量,减少了模型冗余的同时,提高丢包补偿的速度,进而能够提高丢包补偿算法的实时性。

    一种音频数据的处理方法、对应装置、设备和存储介质

    公开(公告)号:CN115512709B

    公开(公告)日:2025-02-11

    申请号:CN202110630042.3

    申请日:2021-06-07

    Inventor: 廖健平

    Abstract: 本申请实施例公开了一种音频数据的处理方法、对应装置、设备和存储介质,该方法包括:针对音频的每一个数据帧,对数据帧的数据部分进行处理,得到基础数据和扩展数据;根据数据帧的基础数据和至少一个其他数据帧的基础数据,确定数据帧的基础数据对应的校正数据;将音频的各个数据帧对应的基础数据、扩展数据和校正数据发送至数据接收端,以使数据接收端根据对应的校正数据恢复损坏的基础数据后,与扩展数据组合进行播放操作。用以在音频数据损坏时,提高数据恢复的概率和恢复后的音频数据的质量。

    音频处理方法、装置、电子设备及存储介质

    公开(公告)号:CN114360555B

    公开(公告)日:2024-12-24

    申请号:CN202111602396.3

    申请日:2021-12-24

    Inventor: 郑羲光 李楠 张晨

    Abstract: 本公开提供了一种音频处理方法、装置、电子设备及存储介质,所述音频处理方法包括:通过用于编码的自学习网络对输入音频信号进行编码;将编码后的音频信号划分为N个编码流,其中,N为大于1的整数;在所述N个编码流中以预设方式选择n个编码流置零,其中,n为0到N‑1中的任意一个整数;对所述N个编码流中置零后的剩余编码流进行量化和整合以生成整合的编码流;通过用于解码的自学习网络对整合的编码流进行解码以获得解码的音频信号;将解码的音频信号与所述输入音频信号进行对比并根据对比结果调整用于编码的自学习网络和用于解码的自学习网络。本公开的音频处理方法能够在低码率下实现高音质,并且能够应对恶劣的传输信道条件。

    基于禁忌转移矩阵的声码器参数误码掩盖方法及系统

    公开(公告)号:CN114913862B

    公开(公告)日:2024-08-23

    申请号:CN202210616043.7

    申请日:2022-06-01

    Abstract: 本发明属于语音信号处理技术领域,提供了基于禁忌转移矩阵的声码器参数误码掩盖方法及系统,该方法包括在不额外增加检错比特的前提下,充分利用声码器参数的帧间相关性,构造有关参数的禁忌转移矩阵,在接收端利用禁忌转移矩阵进行误码检测,当发现参数出现误码时,再利用比特反转技术从量化码本中寻找转移概率最大的矢量进行差错参数替代,从而进行有效的误码掩盖,有效改善误码发生时的合成语音质量,可以提高低速率声码器通过误码信道时的合成语音质量。

    音频处理方法、装置及设备
    7.
    发明公开

    公开(公告)号:CN118230742A

    公开(公告)日:2024-06-21

    申请号:CN202211644420.4

    申请日:2022-12-20

    Abstract: 本公开提供一种音频处理方法、装置及设备,该方法包括,获取音频帧;确定所述音频帧相关联的扩展码流和至少两路音频编码流,所述扩展码流包括所述音频帧前第N帧的音频编码数据和/或所述音频帧的带宽扩展数据,所述N为大于0的整数,所述至少两路音频编码流与所述音频帧的多描述编码相关联;基于所述至少两路音频编码流和所述扩展码流,生成所述音频帧的编码数据;向第二设备发送所述编码数据。避免音频播放卡顿,提高音频播放的质量。

    一种双声道到多声道的上混方法、装置、存储介质及设备

    公开(公告)号:CN118197325A

    公开(公告)日:2024-06-14

    申请号:CN202410289229.5

    申请日:2024-03-14

    Abstract: 本申请公开了一种双声道到多声道的上混方法、装置、存储介质及设备,属于蓝牙音频编解码技术领域,该方法包括获取双声道LC3码流,并对其执行部分解码,得到左、右声道谱系数;将左、右声道谱系数相加,得到中间声道谱系数;根据中间声道谱系数,利用第一预训练神经模型得到中置声道谱系数;根据左声道谱系数,利用第二预训练神经模型得到左环绕声道谱系数;根据右声道谱系数,利用第三预训练神经模型得到右环绕声道谱系数;对中间声道谱系数低通滤波得到重低音声道谱系数;根据左声道谱系数、右声道谱系数、中置声道谱系数、左环绕声道谱系数、右环绕声道谱系数和重低音声道谱系数,执行时频逆变换,输出多声道的音频。本申请增强了用户的沉浸感。

    编码、解码方法、编码器、解码器、电子设备和存储介质

    公开(公告)号:CN117831546A

    公开(公告)日:2024-04-05

    申请号:CN202211204797.8

    申请日:2022-09-29

    Abstract: 本公开实施例提供了编码、解码方法、编码器、解码器、电子设备和存储介质。编码方法包括:将当前媒体帧编码为至少两个当前多描述码流;确定第一码流;生成当前媒体帧的一个目标码流,所述目标码流包括所述第一码流,所述目标码流包括填充数据部分能够与设定编码器兼容。在目标码流的填充数据部分包括一个或多个当前多描述码流、历史媒体帧的多描述码流、和/或当前媒体帧的增强编码信息,提高了解码质量和抗丢包性。

    音频处理方法及装置
    10.
    发明授权

    公开(公告)号:CN113035207B

    公开(公告)日:2024-03-22

    申请号:CN202110234594.2

    申请日:2021-03-03

    Abstract: 本说明书提供音频处理方法及装置,其中所述音频处理方法包括:获取待处理音频;对所述待处理音频进行预处理,获得所述待处理音频对应的全局频域帧序列;根据所述全局频域帧序列构建所述待处理音频对应的音频特征集合,并将所述音频特征集合输入至音频处理模型进行处理获得局部频域帧序列;基于所述局部频域帧序列和所述全局频域帧序列生成用于替换所述待处理音频的目标音频,实现了精准的对待处理音频进行补偿,有效的提高了补偿效率以及补偿精准度。

Patent Agency Ranking