基于自监督与混合注意力机制的音乐流派分类方法及装置

    公开(公告)号:CN119832883A

    公开(公告)日:2025-04-15

    申请号:CN202510295073.6

    申请日:2025-03-13

    Inventor: 何璇 叶丽心 尤佳

    Abstract: 本发明公开了一种基于自监督与混合注意力机制的音乐流派分类方法及装置,涉及音乐分类领域,包括:构建音乐流派分类模型并训练,得到经训练的音乐流派分类模型;获取待分类的音频数据,将待分类的音频数据输入到经训练的音乐流派分类模型中,待分类的音频数据经过特征提取层,提取得到对应的特征序列;将特征序列输入到混合注意力机制层中,得到混合特征;将混合特征输入到深度建模层中,先经过若干个Transformer编码层进行上下文依赖建模,再将最后一个Transformer编码层的输出特征输入到全局平均池化层,得到建模向量;将建模向量输入到分类层中,得到待分类的音频数据所对应的音频流派预测标签。本发明解决现有的音乐流派分类的精度低、适用性弱等问题。

Patent Agency Ranking