-
公开(公告)号:CN115146762B
公开(公告)日:2024-10-29
申请号:CN202210668973.7
申请日:2022-06-14
Applicant: 兰州理工大学
IPC: G06N3/0464 , G06N3/045 , G06N3/048 , G06N3/094
Abstract: 本发明公开了一种基于SE模块增强ViT模型鲁棒性的方法,包括步骤:使用多种对抗攻击算法生成对抗样本,验证所提出现有的ViT模型的防御方法在面对不同对抗样本时的鲁棒性;将对抗样本输入所提出ViT模型的Convolutional Token Embedding层,然后再通过归一化层;将S2得到的特征输入SE‑Transformer块,特征首先经过SE模块,然后计算特征的Query、Key和Value值;将步骤S2、S3重复执行,并在最后阶段中添加cls分类标记;使用MLP Head预测最终的类别,计算准确率。本发明利用SE模块突出每个特征图的重要信息,抑制次要信息,有助于模型进行关键特征的提取,强化通道的特征信息,减少无用的特征;同时结合ViT模型的自注意力机制(self‑attention)可以提取特征的长距离信息。
-
公开(公告)号:CN119478116A
公开(公告)日:2025-02-18
申请号:CN202411475687.4
申请日:2024-10-22
Applicant: 兰州理工大学
IPC: G06T11/20 , G06T11/00 , G06V30/22 , G06V30/18 , G06V30/186 , G06V30/19 , G06N3/0455 , G06N3/0464 , G06N3/0475 , G06N3/0895 , G06F40/109
Abstract: 本发明公开了一种基于对比学习和扩散模型的手写字体生成方法,包括步骤:使用ResNeSt作为模型提取特征图的主干网络,然后将特征图向量输入到Transformer编码器中进行全局特征提取;再使用CNN解码器和Transformer解码器生成手写字体图像;将生成的字体图像进行加噪处理;然后使用扩散模型从带噪声的图像中预测噪声,最后通过去噪公式计算出原始图像;将扩散模型生成的字体图像与真实图像使用对比学习计算出两者的对比损失函数,用来促使生成的图像向真实图像靠拢;本发明克服了目前模型生成字体不够逼真的问题,有效地提高了生成的手写字体质量,使得生成的字体与真实的字体在内容和风格上更为一致。
-
公开(公告)号:CN118587321A
公开(公告)日:2024-09-03
申请号:CN202410629888.9
申请日:2024-05-21
Applicant: 兰州理工大学
IPC: G06T11/60 , G06T11/40 , G06V10/82 , G06V30/18 , G06V30/19 , G06N3/0455 , G06N3/0464
Abstract: 本发明公开了一种基于Res2Net和多频谱通道注意力的手写字体生成方法,包括步骤:使用融合多频谱通道注意力的Res2Net网络生成特征图,展平得到特征图序列;将特征图序列向量拼接到一起得到单个张量;使用Transformer编码器对特征序列的局部和全局组合进行建模;将Transformer编码器输出的特征序列经过多个连续的Transformer解码器层处理得到特征向量,在输出中加入一个随机采样的噪声向量用来模拟笔迹的自然变化;将这些特征向量串联起来通过一个线性层得到向量矩阵,再经过一个具有4个卷积块的CNN解码器和Tanh激活层得到最终的手写字体图像。本发明克服了在提取特征阶段无法提取到字体细粒度特征的问题,有效地提高了生成的手写字体质量,与真实手写字体的内容和风格更为接近。
-
公开(公告)号:CN115146762A
公开(公告)日:2022-10-04
申请号:CN202210668973.7
申请日:2022-06-14
Applicant: 兰州理工大学
Abstract: 本发明公开了一种基于SE模块增强ViT模型鲁棒性的方法,包括步骤:使用多种对抗攻击算法生成对抗样本,验证所提出现有的ViT模型的防御方法在面对不同对抗样本时的鲁棒性;将对抗样本输入所提出ViT模型的Convolutional Token Embedding层,然后再通过归一化层;将S2得到的特征输入SE‑Transformer块,特征首先经过SE模块,然后计算特征的Query、Key和Value值;将步骤S2、S3重复执行,并在最后阶段中添加cls分类标记;使用MLP Head预测最终的类别,计算准确率。本发明利用SE模块突出每个特征图的重要信息,抑制次要信息,有助于模型进行关键特征的提取,强化通道的特征信息,减少无用的特征;同时结合ViT模型的自注意力机制(self‑attention)可以提取特征的长距离信息。
-
-
-