一种机器翻译模型的知识学习方法和装置

    公开(公告)号:CN115511078A

    公开(公告)日:2022-12-23

    申请号:CN202211204260.1

    申请日:2022-09-29

    Applicant: 清华大学

    Abstract: 本发明提供一种机器翻译模型的知识学习方法和装置,包括:构建迁移数据集;分别利用机器翻译教师模型和机器翻译学生模型翻译迁移数据集每一条样本的原文,得到迁移数据集每一条样本的第一候选词概率分布和第二候选词概率分布;根据迁移数据集每一条样本的第一候选词概率分布、第二候选词概率分布以及标准候选词概率分布,确定迁移数据集每一条样本的迁移损失;基于迁移数据集每一条样本的第一候选词概率分布和迁移损失,实现机器翻译学生模型对机器翻译教师模型的知识学习。本发明通过迁移损失,使机器翻译学生模型从机器翻译教师模型中学习到互补性知识,实现机器翻译学生模型的知识累积,进而提升机器翻译学生模型的翻译性能。

Patent Agency Ranking