-
公开(公告)号:CN118644411A
公开(公告)日:2024-09-13
申请号:CN202410783125.X
申请日:2024-06-17
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本公开实施例公开了一种视频生成方法、装置、电子设备及存储介质,该方法包括:获取目标轨迹图,将目标轨迹图输入至配置有原始参数矩阵以及目标秩分解矩阵的运动控制网络,基于原始参数矩阵以及目标秩分解矩阵对目标轨迹图进行映射,得到目标运动特征;获取目标参考内容,提取目标参考内容的第一内容特征;获取目标噪声图像堆栈,将目标噪声图像堆栈、目标运动特征以及第一内容特征输入至扩散模型,以目标运动特征以及第一内容特征作为约束条件对目标噪声图像堆栈进行去噪处理,生成目标视频;本公开实施例能够对视频镜头或者视频展示对象的运动的精细化控制,从而提升生成的视频的质量,可广泛应用于云技术、人工智能、智慧交通等场景。
-
公开(公告)号:CN116958323A
公开(公告)日:2023-10-27
申请号:CN202310820471.6
申请日:2023-07-05
Applicant: 腾讯科技(深圳)有限公司
IPC: G06T11/60 , G06F40/126 , G06F40/30 , G06T3/00
Abstract: 本申请提供了一种基于人工智能的图像生成方法、装置、电子设备、计算机可读存储介质及计算机程序产品;方法包括:获取内容文本,并获取具有目标风格的风格图像;对所述内容文本进行文本编码处理,得到内容文本的内容文本编码,并从所述风格图像中提取风格编码;基于对应所述风格编码以及所述内容文本编码的双路交叉注意力机制,对噪声图像进行逆扩散处理,得到目标图像;其中,所述目标图像与所述内容文本的内容匹配,且所述目标图像具有所述目标风格。通过本申请,能够高效生成兼具指定语义以及参考风格的图像。
-