-
公开(公告)号:CN119233039A
公开(公告)日:2024-12-31
申请号:CN202411239898.8
申请日:2024-09-05
Applicant: 中国移动通信集团浙江有限公司 , 中国移动(浙江)创新研究院有限公司 , 中国移动通信有限公司 , 中国移动通信集团有限公司
IPC: H04N21/81 , H04N21/8549 , H04N21/44 , H04N21/4402 , H04N21/2343 , H04N21/234
Abstract: 本申请提供一种自定义区域动态视频生成方法、装置、设备、介质及产品,属于人工智能技术领域,获取用于视频生成内容描述的文本以及用于作为视频背景的图片;响应于用户在图片中选取的自定义区域,生成掩码图片;输入文本、图片和掩码图片至训练完成的视频生成模型,得到目标视频;视频生成模型通过在预设扩散模型中嵌入时序对齐模块和/或图像控制模块得到,时序对齐模型用于确定目标视频中每帧图像的时序,条件控制模块至少用于根据掩码图片确定目标视频的动态区域。本申请通过增加时序对齐模块以及条件控制模块优化视频生成质量及内容,并通过掩码操作实现指定区域的动态生成,解决了现有技术无法进行动态区域选择、视频内容难以控制的问题。
-
公开(公告)号:CN119420423A
公开(公告)日:2025-02-11
申请号:CN202411700620.6
申请日:2024-11-26
Applicant: 中国移动通信集团浙江有限公司 , 中国移动(浙江)创新研究院有限公司 , 中国移动通信集团有限公司 , 中国移动通信有限公司
Abstract: 本发明提供一种基于参数服务器架构的光互连系统及其数据交互方法,该系统包括至少一个服务节点和多个工作节点;其中,任一服务节点的光发射端通过光纤连接至任一工作节点的光接收端;任一工作节点的光发射端,通过光纤连接至任一服务节点的光接收端;任一工作节点,用于从与其连接的任一服务节点拉取模型参数;任一工作节点,还用于获取训练数据,利用训练数据执行训练任务,得到任务执行结果;将任务执行结果通过任一工作节点的光发射端发送至任一服务节点;任一服务节点,用于基于任务执行结果更新模型参数。本申请将server节点与worker节点采用光纤直连,不需要经过交换机转发,省去了一次光电‑电光转换,大大节省了经济、功耗成本,降低了网络延迟。
-
公开(公告)号:CN119180941A
公开(公告)日:2024-12-24
申请号:CN202411227943.8
申请日:2024-09-03
Applicant: 中国移动通信集团浙江有限公司 , 中国移动(浙江)创新研究院有限公司 , 中国移动通信集团有限公司 , 中国移动通信有限公司
IPC: G06V10/25 , G06V10/764 , G06V10/40 , G06N5/04 , G06F18/213 , G06F18/22 , G06F18/25
Abstract: 本发明提供一种基于多标签分类的开集目标检测方法、装置、设备和介质,其中方法包括:在开集目标检测模型的融合层的任意一层中嵌入多标签分类层;将多标签分类层和开集目标检测模型的前K层转换为第一推理层,将开集目标检测模型的后N‑K层转换为第二推理层;将目标图像和预设的M个目标类别文本输入至第一推理层,得到图像特征和M个文本特征,以及M个目标类别文本的置信度;基于M个目标类别文本的置信度,对M个文本特征进行过滤,得到过滤后的m个文本特征;在m值不为零的情况下,将过滤后的m个文本特征和图像特征输入至第二推理层,得到目标图像的分类结果。本发明推理加速效果好,无需额外训练成本,不影响定位准确率,通用性强。
-
公开(公告)号:CN119204138A
公开(公告)日:2024-12-27
申请号:CN202411275944.X
申请日:2024-09-12
Applicant: 中国移动通信集团浙江有限公司 , 中国移动(浙江)创新研究院有限公司 , 中国移动通信有限公司 , 中国移动通信集团有限公司
Abstract: 本发明提供一种模型自动剪枝方法、装置、设备、存储介质及程序产品,涉及数据处理技术领域,包括:将模型中任一组待剪枝组的状态信息输入智能体中的actor网络,得到所述待剪枝组的预测压缩比例;基于所述待剪枝组的预测压缩比例对所述待剪枝组进行剪枝,得到第一剪枝组,并基于预设压缩比对所述待剪枝组进行剪枝,得到第二剪枝组;遍历全部待剪枝组,基于所述第一剪枝组与所述第二剪枝组之间的损失扰动,以及长期奖励,对所述智能体进行优化,得到剪枝模型。
-
公开(公告)号:CN119206397A
公开(公告)日:2024-12-27
申请号:CN202411335740.0
申请日:2024-09-24
Applicant: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司 , 中国移动(浙江)创新研究院有限公司 , 浙江移动信息系统集成有限公司
IPC: G06V10/774 , G06V10/772 , G06V10/80 , G06V10/82 , G06V10/74 , G06N3/045 , G06N3/08 , G06N3/0895
Abstract: 本申请涉及人工智能技术领域,提供一种模型训练方法、装置、设备、存储介质及程序产品。方法包括:将样本图像输入至图像编码模块,获得图像特征;将样本文本输入至文本编码模块,获得文本特征;从预构建的融合提示向量词典中获取样本文本对应的融合提示向量,并将融合提示向量和文本特征输入至向量替换模块,获得混合文本特征;将图像特征和混合文本特征输入至检测器模块,训练视觉提示开集检测模型。通过上述方式,可避免模型出现过拟合或者评估失真的情况,提高视觉提示开集检测模型的泛化性能,降低模型训练开销。
-
公开(公告)号:CN118981385A
公开(公告)日:2024-11-19
申请号:CN202410987881.4
申请日:2024-07-23
Applicant: 中国移动通信集团浙江有限公司 , 中国移动(浙江)创新研究院有限公司 , 中国移动通信集团有限公司
Abstract: 本申请公开了一种数据处理方法、装置、电子设备、存储介质及程序产品,属于数据处理技术领域,用以降低显存占用,提供数据处理效率。所述方法包括:确定用于处理待处理数据的目标专家模型;通过第一内存的共享权重和第二内存的目标低秩矩阵构造所述目标专家模型,所述目标低秩矩阵为预先对所述目标专家模型进行分解得到的;通过所述目标专家模型处理所述待处理数据。
-
公开(公告)号:CN118803045A
公开(公告)日:2024-10-18
申请号:CN202311541905.5
申请日:2023-11-16
Applicant: 中国移动通信集团浙江有限公司 , 中国移动(浙江)创新研究院有限公司 , 中国移动通信集团有限公司
IPC: H04L67/561 , H04L67/303
Abstract: 本申请涉及云计算技术领域,提供一种定制化服务部署方法、装置、设备及存储介质。该方法包括:获取目标用户针对定制化服务的服务生成请求;请求中携带目标用户的网络位置和定制化请求配置文件;根据网络位置确定定制化任务在算力网络中对应的最优算力节点;将定制化请求配置文件发送至最优算力节点进行服务部署。通过定制化请求配置文件中的任务向量引导定制化任务的输出结果,将定制化请求配置文件在算力网络间进行传输,使得定制化任务可以在适当的算力节点中实现低开销的部署,无需在算力网络下对算法模型或服务镜像进行调度存储,同时,可以避免业务场景扩充和长尾问题导致模型版本更新频繁,解决了定制化服务部署开销大的问题。
-
公开(公告)号:CN118799613A
公开(公告)日:2024-10-18
申请号:CN202410353054.X
申请日:2024-03-26
Applicant: 中国移动通信集团浙江有限公司 , 中国移动(浙江)创新研究院有限公司 , 中国移动通信集团有限公司
IPC: G06V10/764 , G06V10/74 , G06N5/025 , G06V10/774
Abstract: 本申请涉及目标检测技术领域,提供开集目标检测图像提示引导方法、装置、设备及存储介质,方法包括:提示向量初始化,根据显卡显存大小设置提示向量的数量和维度,构建双向解耦掩膜,双向解耦掩膜的长度与提示向量的长度相同,双向解耦掩膜包括分类子掩膜和定位子掩膜;根据样本数据集和双向解耦掩膜进行知识提取,以生成图像提示向量;双向解耦掩膜在分类和定位计算相似度时分别遮盖图像提示向量的不同区域;将待检测图像和与图像提示向量输入至目标检测模型,得到新类别的目标检测结果;图像提示向量用于引导目标检测模型实现新类别物体的检测。本申请避免了以往方法中手工调优文本提示的过程,减少人工成本,且具有更好的细粒度分类能力。
-
公开(公告)号:CN119445205A
公开(公告)日:2025-02-14
申请号:CN202411443367.0
申请日:2024-10-16
Applicant: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司 , 中国移动(浙江)创新研究院有限公司 , 浙江移动信息系统集成有限公司
IPC: G06V10/764 , G06V10/40 , G06V10/774
Abstract: 本发明提供一种目标检测方法、装置、设备、存储介质和计算机程序产品,涉及人工智能技术领域,该方法包括:获取待检测文本和待检测图像;将待检测文本和待检测图像输入开集目标检测模型,得到开集目标检测模型输出的检测结果;其中,开集目标检测模型包括图像信息与文本信息的混合模块,混合模块包括多层多头自注意力机制和多层基于类别引导的多头交叉注意力机制,混合模块用于对第一图像类别特征向量与待检测文本的文本特征进行增强,得到第一强化文本特征。本发明通过在开集目标检测模型中引入混合模块,将图像类别特征向量与文本特征相结合,使文本特征带有图像语义信息,从而减少语义歧义带来的影响,提高模型的零样本和少样本推理能力。
-
公开(公告)号:CN119026663A
公开(公告)日:2024-11-26
申请号:CN202411107391.7
申请日:2024-08-13
Applicant: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司 , 中国移动(浙江)创新研究院有限公司 , 浙江移动信息系统集成有限公司
IPC: G06N3/082
Abstract: 本发明提供一种单次网络剪枝方法、装置、设备、介质及产品,方法包括:获取单个网络层中权重矩阵对应的剪枝掩码矩阵;将权重矩阵中第一列确定为当前剪枝列;基于剪枝掩码矩阵,对当前剪枝列的权重进行修剪;基于当前剪枝列中已修剪的权重,确定权重矩阵中待更新列的待更新权重;基于海森矩阵的逆矩阵,对待更新权重进行更新;将当前剪枝列的下一列确定为当前剪枝列,并迭代执行权重修剪和权重更新的步骤,直至当前剪枝列为倒数第二列;基于剪枝掩码矩阵,对权重矩阵中最后一列的权重进行修剪,以获得网络层剪枝后的权重矩阵。本发明提供的单次网络剪枝方法,降低了算法的计算复杂度,从而减少计算资源和时间的成本,有效提高单次网络剪枝的效率。
-
-
-
-
-
-
-
-
-