-
公开(公告)号:CN118555423B
公开(公告)日:2024-10-25
申请号:CN202411001898.4
申请日:2024-07-25
Applicant: 北京衔远有限公司 , 上海飞朗天思科技有限公司
IPC: H04N21/2343 , H04N21/234 , G06V20/40 , G06V10/80
Abstract: 本申请涉及人工智能技术领域,提供了一种目标视频生成方法、装置、电子设备及可读存储介质,该方法包括:对第一参考图像和第二参考图像分别进行潜空间特征提取,并进行加权融合处理,得到对应的参考图像的多个第一融合特征图;对第一参考图像和第二参考图像分别进行视觉特征提取并进行加权拼接处理,得到对应的参考图像的多个第二融合特征图;基于各个第一融合特征图、各个第二融合特征图、第一参考图像的视觉特征图和第二参考图像的视觉特征图进行扩散处理,生成目标视频的多个视频帧的特征图;根据目标视频的多个视频帧的特征图,生成目标视频,解决现有技术中视频生成最后一帧图像不可控的问题,提高目标视频的准确性和流畅性。
-
公开(公告)号:CN118555423A
公开(公告)日:2024-08-27
申请号:CN202411001898.4
申请日:2024-07-25
Applicant: 北京衔远有限公司 , 上海飞朗天思科技有限公司
IPC: H04N21/2343 , H04N21/234 , G06V20/40 , G06V10/80
Abstract: 本申请涉及人工智能技术领域,提供了一种目标视频生成方法、装置、电子设备及可读存储介质,该方法包括:对第一参考图像和第二参考图像分别进行潜空间特征提取,并进行加权融合处理,得到对应的参考图像的多个第一融合特征图;对第一参考图像和第二参考图像分别进行视觉特征提取并进行加权拼接处理,得到对应的参考图像的多个第二融合特征图;基于各个第一融合特征图、各个第二融合特征图、第一参考图像的视觉特征图和第二参考图像的视觉特征图进行扩散处理,生成目标视频的多个视频帧的特征图;根据目标视频的多个视频帧的特征图,生成目标视频,解决现有技术中视频生成最后一帧图像不可控的问题,提高目标视频的准确性和流畅性。
-
公开(公告)号:CN118820430A
公开(公告)日:2024-10-22
申请号:CN202410895327.3
申请日:2024-07-04
IPC: G06F16/332 , G06F16/33 , G06F16/36 , G06F40/295 , G06F40/30 , G06F40/211 , G06N5/022 , G06N20/00
Abstract: 本申请涉及自然语言处理技术领域,提供了一种知识发现系统的训练方法、装置、电子设备及存储介质。该方法包括:获取训练集中的文章和用户的知识需求,文章和知识需求对应相同知识领域;利用大语言模型对文章进行处理,生成总结信息,总结信息包括相同知识领域的内容总结、相同知识领域内文章之间的关联信息以及每篇文章对应的相关信息;根据知识需求、内容总结、关联信息以及相关信息,利用预先构建的多智能体进行知识推理,得到知识发现结果;基于知识发现结果和真实标签,对知识发现系统进行训练,得到训练后的知识发现系统。本申请解决了现有技术对于知识发现的成本较高问题。
-
公开(公告)号:CN118333125A
公开(公告)日:2024-07-12
申请号:CN202410389516.3
申请日:2024-04-01
Applicant: 北京衔远有限公司
IPC: G06N3/082 , G06N3/0455
Abstract: 本公开提供了一种图像生成模型的微调训练方法及装置。该方法包括:为图像生成模型增加微调分支,得到微调模型;将各个正样本和各个负样本输入微调模型,通过微调模型的扩散过程为各个正样本和各个负样本添加噪声,通过微调模型的逆扩散过程预测并去除扩散过程中为各个正样本和各个负样本添加的噪声;根据各个正样本对应添加的噪声和预测的噪声,计算各个正样本的匹配损失,根据各个负样本对应添加的噪声和预测的噪声,计算各个负样本的非匹配损失;依据各个正样本的匹配损失和各个负样本的非匹配损失优化微调模型的模型参数,以完成对微调模型的微调训练。采用上述技术手段,解决现有技术中图像生成模型生成图像还原性差的问题。
-
公开(公告)号:CN118658032A
公开(公告)日:2024-09-17
申请号:CN202410999837.5
申请日:2024-07-24
Applicant: 北京衔远有限公司 , 北京衔远科技有限公司
IPC: G06V10/80 , G06N3/08 , G06V10/82 , G06V20/40 , G06N3/0499
Abstract: 本申请涉及计算机技术领域,提供了一种视频生成模型的训练方法、装置、电子设备及存储介质。该方法包括:将各个训练样本输入视频生成模型,对各个训练视频帧、时间步进行特征嵌入,得到训练视频帧的特征图和时间步的特征图;将训练视频帧的特征图和时间步的特征图输入视频生成模型的多个多层感知机多次迭代扩散处理并进行解码得到预测视频的各个视频帧;基于预测视频的各个视频帧和训练视频的各个训练视频帧计算视频生成模型的损失值,并根据损失值更新视频生成模型的参数。解决了现有技术中基于注意力机制的扩散模型训练耗费大量计算资源且训练速度慢的问题,实现以较低计算成本生成高质量的视觉内容。
-
公开(公告)号:CN118820430B
公开(公告)日:2025-05-06
申请号:CN202410895327.3
申请日:2024-07-04
IPC: G06F16/3329 , G06F16/334 , G06F16/36 , G06F40/295 , G06F40/30 , G06F40/211 , G06N5/022 , G06N20/00
Abstract: 本申请涉及自然语言处理技术领域,提供了一种知识发现系统的训练方法、装置、电子设备及存储介质。该方法包括:获取训练集中的文章和用户的知识需求,文章和知识需求对应相同知识领域;利用大语言模型对文章进行处理,生成总结信息,总结信息包括相同知识领域的内容总结、相同知识领域内文章之间的关联信息以及每篇文章对应的相关信息;根据知识需求、内容总结、关联信息以及相关信息,利用预先构建的多智能体进行知识推理,得到知识发现结果;基于知识发现结果和真实标签,对知识发现系统进行训练,得到训练后的知识发现系统。本申请解决了现有技术对于知识发现的成本较高问题。
-
公开(公告)号:CN118194856B
公开(公告)日:2025-03-11
申请号:CN202410257669.2
申请日:2024-03-06
IPC: G06F40/279 , G06F40/295 , G06F40/16 , G06N3/045 , G06N3/08
Abstract: 本公开提供了一种基于代码大语言模型的数据处理方法及装置。该方法包括:获取待处理数据和待处理数据对应的目标任务;利用大语言模型按照目标任务提取待处理数据的提示指导信息;将待处理数据和提示指导信息分别转换为预设格式的数据代码和提示代码;从模型库中获取到目标任务对应的目标代码大语言模型;利用目标代码大语言模型依据提示代码处理数据代码,得到处理结果。采用上述技术手段,解决现有技术中信息抽取效率和准确率低的问题。
-
公开(公告)号:CN117911230A
公开(公告)日:2024-04-19
申请号:CN202410312854.7
申请日:2024-03-19
Abstract: 本发明提供一种基于扩散模型的图像隐形水印嵌入检测处理方法及装置。该基于扩散模型的图像隐形水印嵌入检测处理方法包括:获取原始图像、水印图像和随机加密序列;根据所述随机加密序列对所述原始图像和所述水印图像进行正向扩散处理,得到图像混合特征数据;根据所述随机加密序列对所述图像混合特征数据进行逆向去噪处理,得到图像特征;当所述原始图像为待嵌入水印图像时,根据所述图像特征得到水印嵌入图像;当所述原始图像为已嵌入水印图像时,根据水印解码器解码所述图像特征得到水印特征,根据所述水印特征和所述水印图像得到水印检测结果。本发明具备清晰的水印提取、嵌入、检测能力和难以擦除和修改的优势。
-
公开(公告)号:CN117911230B
公开(公告)日:2024-06-25
申请号:CN202410312854.7
申请日:2024-03-19
Abstract: 本发明提供一种基于扩散模型的图像隐形水印嵌入检测处理方法及装置。该基于扩散模型的图像隐形水印嵌入检测处理方法包括:获取原始图像、水印图像和随机加密序列;根据所述随机加密序列对所述原始图像和所述水印图像进行正向扩散处理,得到图像混合特征数据;根据所述随机加密序列对所述图像混合特征数据进行逆向去噪处理,得到图像特征;当所述原始图像为待嵌入水印图像时,根据所述图像特征得到水印嵌入图像;当所述原始图像为已嵌入水印图像时,根据水印解码器解码所述图像特征得到水印特征,根据所述水印特征和所述水印图像得到水印检测结果。本发明具备清晰的水印提取、嵌入、检测能力和难以擦除和修改的优势。
-
公开(公告)号:CN118194856A
公开(公告)日:2024-06-14
申请号:CN202410257669.2
申请日:2024-03-06
IPC: G06F40/279 , G06F40/295 , G06F16/332 , G06N3/045 , G06N3/08
Abstract: 本公开提供了一种基于代码大语言模型的数据处理方法及装置。该方法包括:获取待处理数据和待处理数据对应的目标任务;利用大语言模型按照目标任务提取待处理数据的提示指导信息;将待处理数据和提示指导信息分别转换为预设格式的数据代码和提示代码;从模型库中获取到目标任务对应的目标代码大语言模型;利用目标代码大语言模型依据提示代码处理数据代码,得到处理结果。采用上述技术手段,解决现有技术中信息抽取效率和准确率低的问题。
-
-
-
-
-
-
-
-
-