面向对话场景的多模态情感识别方法

    公开(公告)号:CN119397025A

    公开(公告)日:2025-02-07

    申请号:CN202411227725.4

    申请日:2024-09-03

    Applicant: 重庆大学

    Abstract: 本申请提供一种面向对话场景的多模态情感识别方法,涉及计算机处理技术领域。方法包括:获取包括记录同一对话场景的音频文件、视频文件和文本文件的待测样本;通过预设多模态情感识别策略,对待测样本进行情感识别,分别得到包括待测样本对应的单模态预测概率分布的第一识别结果和包括待测样本对应的多模态融合预测概率分布的第二识别结果;对第一识别结果和第二识别结果进行拼接,得到表征当前语句情感状态的情感预测结果。如此,通过对对话场景中的语句进行单模态和多模态的双重情感识别,并对二者进行拼接得到情感预测结果,能够更好的适应复杂对话场景对情感识别结果造成的影响,改善情感识别误差较大、与情感影响因素关联性较低的问题。

Patent Agency Ranking