-
公开(公告)号:CN118172432B
公开(公告)日:2024-10-18
申请号:CN202410377100.X
申请日:2024-03-29
Applicant: 浙江吉利控股集团有限公司 , 吉利汽车研究院(宁波)有限公司
IPC: G06T11/00 , G06T7/11 , G06T7/194 , G06T5/70 , G06T5/60 , G06N3/0475 , G06N3/0455
Abstract: 本申请公开了一种姿势调整方法、装置、电子设备及存储介质,所述姿势调整方法包括以下步骤:获取待调整图片和姿势信息;通过区域分割模型从所述待调整图片中提取目标人物的初始人物图像以及背景图像;通过扩散模型,基于所述初始人物图像、所述背景图像以及所述姿势信息,生成姿势调整后的目标图片。本申请解决了相关技术中调整照片中人物姿势的操作复杂性较高的技术问题。
-
公开(公告)号:CN119421015A
公开(公告)日:2025-02-11
申请号:CN202411637716.2
申请日:2024-11-15
Applicant: 浙江吉利控股集团有限公司 , 吉利汽车研究院(宁波)有限公司
IPC: H04N21/81 , H04N21/854
Abstract: 本说明书提供一种生成视频的方法、装置、电子设备和存储介质,所述方法包括:从动作参考视频中提取动作主体的身体的骨骼数据和第一轮廓数据,所述第一轮廓数据包括该身体除头部之外其余部分的轮廓数据;以及,确定至少包括所述骨骼数据和第一轮廓数据的第一控制信息,并基于所述第一控制信息和基准角色数据控制视频生成模型生成中间视频;从所述中间视频中提取合成主体的身体的第二轮廓数据,所述第二轮廓数据包括该身体头部的轮廓数据;以及,确定至少包括所述骨骼数据和所述第二轮廓数据的第二控制信息,并基于所述第二控制信息控制所述视频生成模型生成目标视频。
-
公开(公告)号:CN119599011A
公开(公告)日:2025-03-11
申请号:CN202411637719.6
申请日:2024-11-15
Applicant: 浙江吉利控股集团有限公司 , 吉利汽车研究院(宁波)有限公司
IPC: G06F40/284 , G06F40/242 , G06F40/30 , G06N20/00 , G06F40/274
Abstract: 本申请提供一种多音字预测方法、装置、设备及可读存储介质,所述方法通过利用学习到不同分词方式下多音字的语义信息与发音特征的读音预测网络,针对包含待测多音字的处理文本的分词序列提取待测多音字的上下文嵌入,并利用读音预测网络中训练得到的线性投影矩阵,融合目标分词及其词性信息确定条件权重矩阵,利用该条件权重矩阵动态调整网络输出过程中针对不同读音标签的预测概率,使得读音预测网络能够更好地理解多音字所在的语境,提高了多音字预测的准确性与鲁棒性。
-
公开(公告)号:CN118172432A
公开(公告)日:2024-06-11
申请号:CN202410377100.X
申请日:2024-03-29
Applicant: 浙江吉利控股集团有限公司 , 吉利汽车研究院(宁波)有限公司
IPC: G06T11/00 , G06T7/11 , G06T7/194 , G06T5/70 , G06T5/60 , G06N3/0475 , G06N3/0455
Abstract: 本申请公开了一种姿势调整方法、装置、电子设备及存储介质,所述姿势调整方法包括以下步骤:获取待调整图片和姿势信息;通过区域分割模型从所述待调整图片中提取目标人物的初始人物图像以及背景图像;通过扩散模型,基于所述初始人物图像、所述背景图像以及所述姿势信息,生成姿势调整后的目标图片。本申请解决了相关技术中调整照片中人物姿势的操作复杂性较高的技术问题。
-
-
-