一种基于文本驱动的口型动画生成方法及系统

    公开(公告)号:CN116309984A

    公开(公告)日:2023-06-23

    申请号:CN202310045379.7

    申请日:2023-01-30

    Abstract: 本发明提供一种基于文本驱动的口型动画生成方法及系统,所述方法包括:定义数字虚拟人的口型动作数据集合,建立预训练模型;输入语言文本的文本序列,对文本序列进行音素识别;通过预训练模型将音素和口型动作之间进行关系映射,输出口型动作帧序列;将口型动作帧序列进行连续帧的口型动画合成,对口型动作帧进行动画帧的线性插值,使文本长度和动画长度保持一致,同时保持语言文本与口型动画的同步。本发明可有效地结合语言学和图形学的特点构造出完整的口型动作数据集合,便于后续口型动作的生成;结合预训练模型可完成音素与口型动作帧之间的映射关系;如采用注意力模型,可完成前后相关音素的输出,提供更好的动作补偿,提高了口型动画效果。

Patent Agency Ranking