-
公开(公告)号:CN117556009A
公开(公告)日:2024-02-13
申请号:CN202311520634.5
申请日:2023-11-13
Applicant: 合肥工业大学
IPC: G06F16/332 , G06F40/35 , G06N3/0442 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种基于条件扩散模型的多轮对话生成方法、系统、存储介质和电子设备,涉及自然语言处理技术领域。本发明基于预先训练好的条件扩散模型,首先获取多轮对话上下文;其次获取所述多轮对话上下文的上下文表示,并从标准高斯分布中随机采样一个高斯噪音;再次基于所述条件扩散模型,在所述上下文表示的引导下逐步去噪,将所述高斯噪音还原为与该多轮对话上下文相符合的潜在变量;最后根据所述上下文表示和潜在变量,生成最终的回复。引入条件扩散模型拟合潜在变量分布,充分利用训练数据中的丰富潜在信息,使得生成的回复相关性和多样性更强。
-
公开(公告)号:CN117315753A
公开(公告)日:2023-12-29
申请号:CN202311259802.X
申请日:2023-09-26
Applicant: 合肥工业大学
IPC: G06V40/16 , G06V10/82 , G06N3/0464 , G06N3/08 , G06T3/40
Abstract: 本发明提供一种基于注意力和相对距离对齐的低分辨率人脸表情识别方法、系统、存储介质和电子设备,涉及图像处理技术领域。本发明中,引入分为教师模型和学生模型的知识蒸馏,使学生模型学习预先训练好的教师模型的能力,从而提高学生模型在低分辨率人脸表情识别任务上的性能。其中,所述教师模型和学生模型采用相同的端到端结构,减少了应用复杂度,具有广泛的适用性。以及仅在训练阶段执行注意力对齐、相对距离对齐操作,而不在具体预测时执行,大大减少了预测成本。
-