-
公开(公告)号:CN119784609A
公开(公告)日:2025-04-08
申请号:CN202411961241.2
申请日:2024-12-30
Applicant: 浙江吉利控股集团有限公司 , 吉利汽车研究院(宁波)有限公司
Abstract: 本申请提供一种数字人图像生成方法、装置、设备及可读存储介质,所述方法通过模型驱动生成匹配驱动语音数据的多帧中间图像,并通过预先训练的牙齿生成网络结合中间图像之前完成牙齿重建的前K帧修正图像,对当前帧中间图像进行牙齿重建,并通过中间图像上牙齿区域的遮罩处理,根据遮罩图像将中间图像对应的修正图像与该中间图像进行融合,在保证了中间图像上面部表情与唇部口型与驱动语音数据的一致性匹配的同时,实现了对中间图像上牙齿区域的优化,使得数字人的牙齿在视觉上更加清晰、逼真,呈现出自然、合理的排列状态,提升了数字人的整体真实感。
-
公开(公告)号:CN119516999A
公开(公告)日:2025-02-25
申请号:CN202411675350.8
申请日:2024-11-21
Applicant: 浙江吉利控股集团有限公司 , 吉利汽车研究院(宁波)有限公司
Abstract: 本发明提供一种TTS系统、语音合成方法、装置、电子设备和存储介质。所述语音合成方法包括获取目标文本对应的音素序列;以及,提取基准语音的条件特征并将所述基准语音处理为离散化的编码表示,所述条件特征包括声学特征和/或语义特征;将所述音素序列、所述条件特征和所述编码表示输入预训练的语音合成模型,并获取所述语音合成模型输出的匹配于所述目标文本的目标语音;其中,所述语音合成模型包括神经编解码语言模型及其连接的音频解码器,所述神经编解码语言模型包含自回归模块且不包含非自回归模块。
-
公开(公告)号:CN118797169B
公开(公告)日:2024-12-31
申请号:CN202411272625.3
申请日:2024-09-11
Applicant: 浙江吉利控股集团有限公司 , 吉利汽车研究院(宁波)有限公司
IPC: G06F16/9535 , H04L67/12 , G06F16/9537
Abstract: 本申请提出了一种主动提供车辆服务的方法、设备、介质及程序产品。该方法可以包括:获取车辆的行车数据,并根据获取到的行车数据确定所述车辆所处的目标行车场景;确定所述目标行车场景对应的目标工作流,所述目标工作流基于目标用户的用车习惯生成且所述目标工作流包括至少一个目标车辆服务,所述目标用户为当前驾驶所述车辆的用户;执行所述目标工作流,以向所述目标用户提供所述目标车辆服务。根据本申请的技术方案,可以实现主动根据目标行车场景向用户提供目标车辆服务。
-
公开(公告)号:CN118172432B
公开(公告)日:2024-10-18
申请号:CN202410377100.X
申请日:2024-03-29
Applicant: 浙江吉利控股集团有限公司 , 吉利汽车研究院(宁波)有限公司
IPC: G06T11/00 , G06T7/11 , G06T7/194 , G06T5/70 , G06T5/60 , G06N3/0475 , G06N3/0455
Abstract: 本申请公开了一种姿势调整方法、装置、电子设备及存储介质,所述姿势调整方法包括以下步骤:获取待调整图片和姿势信息;通过区域分割模型从所述待调整图片中提取目标人物的初始人物图像以及背景图像;通过扩散模型,基于所述初始人物图像、所述背景图像以及所述姿势信息,生成姿势调整后的目标图片。本申请解决了相关技术中调整照片中人物姿势的操作复杂性较高的技术问题。
-
公开(公告)号:CN109502276B
公开(公告)日:2020-10-27
申请号:CN201811200111.1
申请日:2018-10-15
Applicant: 宁波吉利汽车研究开发有限公司 , 吉利汽车研究院(宁波)有限公司 , 浙江吉利控股集团有限公司
IPC: B65G43/00
Abstract: 本发明提供了一种补料方法、装置及智能终端,涉及补料技术领域,该补料方法由智能终端执行,包括:接收外部输入的待补物料的信息;根据待补物料的信息,获取待补物料对应的目标补料工位的信息;向物料执行机构发送补料请求,以触发物料执行机构执行补料请求对应的补料操作。本发明能够在生产线不停线的情况下进行补料,有效降低停线带来的经济损失。
-
公开(公告)号:CN119904391A
公开(公告)日:2025-04-29
申请号:CN202510083616.8
申请日:2025-01-20
Applicant: 浙江吉利控股集团有限公司 , 吉利汽车研究院(宁波)有限公司
Abstract: 本公开实施例涉及一种人脸图像修复处理及模型训练方法、装置、设备及介质,其中该方法包括:构建初始人脸图像修复模型,其中,初始人脸图像修复模型中包括预设数量个串联的密集连接残差块和修复图像输出模块,通过预设数量个串联的密集连接残差块提取第一样本人脸图像的第一人脸图像特征图,并通过初始人脸图像修复模型根据第一人脸图像特征图获取并输出实际修复图像;判断模型对应的目标损失值是否大于预设损失阈值;在损失值大于预设损失阈值时,修改初始人脸图像修复模型的模型参数直至对应的损失值小于预设损失阈值时,获取到训练后的人脸图像修复模型。在本技术方案中,提升了人脸图像的质量。
-
公开(公告)号:CN119599011A
公开(公告)日:2025-03-11
申请号:CN202411637719.6
申请日:2024-11-15
Applicant: 浙江吉利控股集团有限公司 , 吉利汽车研究院(宁波)有限公司
IPC: G06F40/284 , G06F40/242 , G06F40/30 , G06N20/00 , G06F40/274
Abstract: 本申请提供一种多音字预测方法、装置、设备及可读存储介质,所述方法通过利用学习到不同分词方式下多音字的语义信息与发音特征的读音预测网络,针对包含待测多音字的处理文本的分词序列提取待测多音字的上下文嵌入,并利用读音预测网络中训练得到的线性投影矩阵,融合目标分词及其词性信息确定条件权重矩阵,利用该条件权重矩阵动态调整网络输出过程中针对不同读音标签的预测概率,使得读音预测网络能够更好地理解多音字所在的语境,提高了多音字预测的准确性与鲁棒性。
-
公开(公告)号:CN119516035A
公开(公告)日:2025-02-25
申请号:CN202411576596.X
申请日:2024-11-06
Applicant: 浙江吉利控股集团有限公司 , 吉利汽车研究院(宁波)有限公司
IPC: G06T11/40 , G06F18/25 , G06V10/80 , G06N3/0475 , G06N3/045
Abstract: 本申请涉及一种车机界面图像处理方法、装置、车载电子终端和存储介质,方法包括:基于车辆的车机接口获取车辆行驶信息,根据车辆行驶信息生成第一描述词;获取车机界面显示的当前图像,从当前图像中提取边缘特征;将第一描述词和当前图像的边缘特征输入至图像扩散模型进行处理,生成第一目标图像。采用本方法能够解决车机界面无法提供与驾驶情境相匹配的视觉体验的问题,实现了车机界面能够提供与驾驶情境相匹配的视觉体验的效果。
-
公开(公告)号:CN119027533A
公开(公告)日:2024-11-26
申请号:CN202411161155.3
申请日:2024-08-22
Applicant: 浙江吉利控股集团有限公司 , 吉利汽车研究院(宁波)有限公司
Abstract: 本说明书提供一种确定图像中对象的截断比例的方法、装置及电子设备,所述方法应用于车辆的视觉仿真系统,包括:生成BEV空间图像;确定目标仿真车辆的图像采集装置在所述BEV空间图像中的视场区域,并根据所述视觉仿真系统的仿真参数确定在待标注图像的采集时刻出现在所述目标仿真车辆周围的目标对象在所述BEV空间图像中的投影区域,其中,所述待标注图像由所述视觉仿真系统进行仿真生成;基于所述视场区域和所述投影区域的图像信息确定所述目标对象在所述待标注图像中的截断比例。
-
公开(公告)号:CN118800234A
公开(公告)日:2024-10-18
申请号:CN202411272627.2
申请日:2024-09-11
Applicant: 浙江吉利控股集团有限公司 , 吉利汽车研究院(宁波)有限公司
Abstract: 本申请提出了一种驾驶交互方法、系统、设备、介质及程序产品。该方法可以包括:获取目标语音,并将所述目标语音转换为目标文本;对所述目标文本进行意图识别,得到意图结果。将所述意图结果输入功能生成模型,生成与所述意图结果相匹配的目标功能脚本并输出,所述目标功能脚本用于实现所述意图结果对应的目标功能;运行所述目标功能脚本以执行所述目标功能实现驾驶交互。根据本申请的技术方案,可以根据用户意图实时生成相应的功能脚本,以通过运行生成的功能脚本来为用户提供相应的功能。
-
-
-
-
-
-
-
-
-