-
公开(公告)号:CN114358272B
公开(公告)日:2025-05-06
申请号:CN202011033839.7
申请日:2020-09-27
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 陈家旭
IPC: G06N3/08 , G06V10/774
Abstract: 本申请实施例提供了一种神经网络训练、图像识别方法及装置,方法包括:将训练样本和对抗样本输入至神经网络,得到神经网络的输出数据;基于输出数据分别计算初始样本的反传梯度和对抗样本的反传梯度;去除对抗样本的反传梯度中与初始样本的反传梯度方向相反的部分,得到目标反传梯度;该去除处理可以削弱对抗样本对初始样本的负向作用,或者说减少对抗样本对初始样本的性能损害,这样就减少了对抗样本对训练过程产生的不良影响;然后,通过将初始样本的反传梯度和目标反传梯度进行反向传播,更新神经网络的参数;迭代更新完成后得到的识别模型输出准确率较高,能够防御对抗样本的攻击。
-
公开(公告)号:CN111724810B
公开(公告)日:2023-11-24
申请号:CN201910209502.8
申请日:2019-03-19
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G10L25/51 , G10L25/30 , G10L25/18 , G10L17/26 , G06V10/764 , G06N3/0464 , G06N3/08 , G06V30/19 , G06F18/214 , G10L17/04 , G10L17/18 , G10L25/03
Abstract: 本申请提供一种音频分类方法和装置,该方法包括:将原始音频数据输入预先训练的音频分类网络模型的第一特征提取网络,以得到所述原始音频数据的类频谱特征;将所述类频谱特征转换为二维音频特征输入到所述预先训练的音频分类网络模型的第二特征提取网络,以得到所述原始音频数据的网络深度特征;将所述原始音频数据的网络深度特征输入到所述预先训练的音频分类网络模型的分类网络,以得到所述原始音频数据的分类结果。该方法可以简化音频分类的操作,提高音频分类的效率。
-
公开(公告)号:CN111261174B
公开(公告)日:2023-02-17
申请号:CN201811456608.X
申请日:2018-11-30
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本公开是关于一种音频的分类方法、装置、终端及计算机可读存储介质,涉及目标分类领域。该方法包括:对第一音频样本数据集中的第一音频样本进行混合,得到第二音频样本数据集,并可以确定第二音频样本数据集中的每个第二多标签音频样本的标签。然后通过每个第二多标签音频样本以及每个第二多标签音频样本的标签,训练得到第一音频分类模型。因此,当需要对待分类的目标音频样本进行分类时,可以通过第一音频分类模型对目标音频样本进行分类。由于该第一音频分类模型是通过多标签音频样本训练得到的,因此,通过第一音频分类模型可以对多标签音频进行分类,提高了对多标签音频进行分类的准确性。
-
公开(公告)号:CN114358272A
公开(公告)日:2022-04-15
申请号:CN202011033839.7
申请日:2020-09-27
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 陈家旭
IPC: G06N3/08 , G06V10/774 , G06K9/62
Abstract: 本申请实施例提供了一种神经网络训练、图像识别方法及装置,方法包括:将训练样本和对抗样本输入至神经网络,得到神经网络的输出数据;基于输出数据分别计算初始样本的反传梯度和对抗样本的反传梯度;去除对抗样本的反传梯度中与初始样本的反传梯度方向相反的部分,得到目标反传梯度;该去除处理可以削弱对抗样本对初始样本的负向作用,或者说减少对抗样本对初始样本的性能损害,这样就减少了对抗样本对训练过程产生的不良影响;然后,通过将初始样本的反传梯度和目标反传梯度进行反向传播,更新神经网络的参数;迭代更新完成后得到的识别模型输出准确率较高,能够防御对抗样本的攻击。
-
公开(公告)号:CN111724810A
公开(公告)日:2020-09-29
申请号:CN201910209502.8
申请日:2019-03-19
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G10L25/51 , G10L25/30 , G10L25/18 , G10L17/26 , G06N3/08 , G06N3/04 , G06K9/66 , G06K9/62 , G10L17/04 , G10L17/18 , G10L25/03
Abstract: 本申请提供一种音频分类方法和装置,该方法包括:将原始音频数据输入预先训练的音频分类网络模型的第一特征提取网络,以得到所述原始音频数据的类频谱特征;将所述类频谱特征转换为二维音频特征输入到所述预先训练的音频分类网络模型的第二特征提取网络,以得到所述原始音频数据的网络深度特征;将所述原始音频数据的网络深度特征输入到所述预先训练的音频分类网络模型的分类网络,以得到所述原始音频数据的分类结果。该方法可以简化音频分类的操作,提高音频分类的效率。
-
公开(公告)号:CN116563902A
公开(公告)日:2023-08-08
申请号:CN202210100862.6
申请日:2022-01-27
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06V40/16 , G06V20/64 , G06V10/764
Abstract: 本申请实施例提供了一种对抗样本生成方法、装置及电子设备。其中,方法包括:获取样本对象的目标区域上设置有标定图像时拍摄所述样本对象得到的第一立体对象图像,所述标定图像包括多个标定点;确定所述第一立体对象图像中各个所述标定点的图像坐标与所述标定图像中各个所述标定点的图像坐标之间的坐标转换关系;根据所述坐标转换关系,生成针对目标对象的对抗补丁;获取所述样本对象的第二立体对象图像,作为对抗样本,所述第二立体对象图像中所述样本对象的目标区域上设置有所述对抗补丁。能够有效生成适用于基于三维图像进行识别的识别模型的对抗样本。
-
公开(公告)号:CN111261174A
公开(公告)日:2020-06-09
申请号:CN201811456608.X
申请日:2018-11-30
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本公开是关于一种音频的分类方法、装置、终端及计算机可读存储介质,涉及目标分类领域。该方法包括:对第一音频样本数据集中的第一音频样本进行混合,得到第二音频样本数据集,并可以确定第二音频样本数据集中的每个第二多标签音频样本的标签。然后通过每个第二多标签音频样本以及每个第二多标签音频样本的标签,训练得到第一音频分类模型。因此,当需要对待分类的目标音频样本进行分类时,可以通过第一音频分类模型对目标音频样本进行分类。由于该第一音频分类模型是通过多标签音频样本训练得到的,因此,通过第一音频分类模型可以对多标签音频进行分类,提高了对多标签音频进行分类的准确性。
-
-
-
-
-
-