-
公开(公告)号:CN117035052B
公开(公告)日:2024-01-26
申请号:CN202311300934.2
申请日:2023-10-10
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06N3/096 , G06N3/0895 , G06N3/094 , G06N3/0455 , G06N3/0475 , G06T11/00 , G06F40/284 , G06F18/25
Abstract: 本申请公开了一种无数据知识蒸馏的方法、装置和存储介质,包括:获取任务的各个目标类别的文本提示;对于每个目标类别的文本提示,将其输入文本‑图像生成模型,经过所述文本‑图像生成模型的处理生成与该文本提示语义相关的所述每个目标类别的训练图像;将视觉语言预训练模型作为教师模型,利用所有目标类别的训练图像蒸馏生成学生模型。应用本申请,能够蒸馏得到较强域泛化能力的学生模型。
-
公开(公告)号:CN114881149A
公开(公告)日:2022-08-09
申请号:CN202210507932.X
申请日:2022-05-10
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请实施例提供了一种模型训练方法及装置、目标检测方法及装置,该方法包括:利用第一模型,对第一无标签数据进行预测,得到第一无标签数据的多个第一预测标签和每个第一预测标签的置信度;根据有标签数据的标签集中每种标签类别的分布情况,确定该标签类别的第一置信度阈值;利用第一模型,对第二无标签数据进行预测,得到第二无标签数据的多个第二预测标签和每个第二预测标签的置信度;在第二预测标签中,确定置信度大于所属标签类别的第一置信度阈值的第二预测标签,作为候选标签;利用有标签数据、第二无标签数据以及候选标签,对第二模型进行训练。应用本申请实施例提供的技术方案,能够降低模型训练所需耗费的人力资源。
-
公开(公告)号:CN117892831A
公开(公告)日:2024-04-16
申请号:CN202211229722.5
申请日:2022-10-09
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06N20/00
Abstract: 本申请提供一种基于无数据知识蒸馏的任务处理方法、装置及电子设备,该方法包括:接收终端设备发送的学生模型获取请求,所述学生模型获取请求携带有任务处理需求;依据所述任务处理需求,获取满足所述任务处理需求的老师模型;依据所述老师模型,对所述多个生成器和所述多个学生模型进行训练;将训练好的所述多个学生模型中的指定学生模型发送给终端设备,由终端设备利用所述指定学生模型进行任务处理。该方法可以提升终端设备利用训练好的学生模型进行任务处理时的准确性。
-
公开(公告)号:CN117035052A
公开(公告)日:2023-11-10
申请号:CN202311300934.2
申请日:2023-10-10
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06N3/096 , G06N3/0895 , G06N3/094 , G06N3/0455 , G06N3/0475 , G06T11/00 , G06F40/284 , G06F18/25
Abstract: 本申请公开了一种无数据知识蒸馏的方法、装置和存储介质,包括:获取任务的各个目标类别的文本提示;对于每个目标类别的文本提示,将其输入文本‑图像生成模型,经过所述文本‑图像生成模型的处理生成与该文本提示语义相关的所述每个目标类别的训练图像;将视觉语言预训练模型作为教师模型,利用所有目标类别的训练图像蒸馏生成学生模型。应用本申请,能够蒸馏得到较强域泛化能力的学生模型。
-
-
-