-
公开(公告)号:CN119723283A
公开(公告)日:2025-03-28
申请号:CN202411767839.8
申请日:2024-12-04
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种基于深度融合网络的AIGC图像检测方法及系统,涉及图像处理技术领域,该AIGC图像检测方法包括:为初始图像数据设置分类标签,得到包含分类标签的标签图像数据;基于时延神经网络建立特征提取模型,并将标签图像数据输入至特征提取模型中,得到标签图像数据的视觉特征;基于深度融合网络将视觉特征与预定义的图像元特征融合,形成图像特征表示;利用人工智能图像检测模型从标签图像数据中检测人工智能图像,得到人工智能图像检测结果。本发明通过多通道的融合方式提供了全局和局部特征的协同提取,可以更全面地捕捉AIGC图像在不同区域的特征分布,从而识别出AIGC图像的细节异常和不对称现象。
-
公开(公告)号:CN115711523B
公开(公告)日:2024-08-23
申请号:CN202211213400.1
申请日:2022-09-29
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种计算机生产用机器抓取机构,涉及计算机制造的技术领域,包括核心安装板、取放机构、加热机构及过渡连接件,核心安装板为矩形板件且水平设置;取放机构设有四个并对应分布于核心安装板的各个拐角处,取放机构用于从主机箱盖的下方向外撑紧或向内释放主机箱盖,取放机构包括固定条一、液压缸一、固定条二、液压缸二及撑紧块;加热机构分布于核心安装板的中心处,加热机构用于从主机箱盖的正上方向下吹出热气流并加热附着于主机箱盖的上表面的水渍或油漆,加热机构包括保温罩、加热块、导热片、电热管、静音扇及绝热柱;过渡连接件分布于加热机构的中心处,过渡连接件用于将机器抓取机构连接到机械臂的末端关节。
-
公开(公告)号:CN118377933B
公开(公告)日:2024-08-16
申请号:CN202410802106.7
申请日:2024-06-20
Applicant: 南京信息工程大学
IPC: G06F16/783 , G06V20/40 , G06V20/62 , G06V10/74 , G06V10/80
Abstract: 本发明提供了基于文本生成图像技术的文本视频检索优化方法,本发明利用Stable Diffusion文本生成图像模型,通过对数据集中的文本信息进行图像生成,将生成的图像信息作为视频帧加入训练集,从而有效扩充数据规模。本发明还将考虑将关键帧信息反向生成文本信息,进一步丰富文本数据集。基于扩充的数据集,本发明将设计新的损失函数,综合考虑视频的细粒度与粗粒度特征,优化文本视频检索模型的训练过程,提升检索效果。本发明通过Stable Diffusion驱动的数据增强及优化的损失函数设计,能够有效解决现有文本视频检索研究中的数据缺乏和模型训练不充分等问题,为多媒体内容分析和检索应用提供新的技术支撑。
-
公开(公告)号:CN116486172A
公开(公告)日:2023-07-25
申请号:CN202310480760.6
申请日:2023-04-28
Applicant: 南京信息工程大学
IPC: G06V10/764 , G06V10/774 , G06N3/04 , G06N3/088
Abstract: 本发明公开了一种基于语义表征的无监督域适应图像分类方法,包括:步骤1)预训练和自训练:使用源域预训练模型,并结合自训练学习初步获取目标域的伪标签;步骤2)提取类别语义表征:通过改变语义向量方向,决策类别的有效语义表征,提取到有效类别语义表征;步骤3)模糊跨域语义表征:以图像域标签为指导,改变跨域样本的语义向量方向,获得跨域语义表征,进一步模糊这些跨域语义表征;步骤4)重构分析:对有效类别语义表征和模糊后的跨域语义表征分别生成新的样本表征,并进行重构分析;步骤5)训练分类器和域判别器:使用新样本表征训练分类器和域判别器,计算分类损失和对抗损失;步骤6)模型优化:梯度计算,优化更新模型参数。
-
公开(公告)号:CN110737769B
公开(公告)日:2023-07-25
申请号:CN201910999118.2
申请日:2019-10-21
Applicant: 南京信息工程大学
IPC: G06F16/34 , G06F40/289 , G06N3/0442 , G06N3/0464 , G06N3/0455 , G06N3/047
Abstract: 本发明公开了一种基于神经主题记忆的预训练文本摘要生成方法,根据完整的输入序列,使用BERT预训练的上下文建模能力,对序列进行编码,完成文本嵌入;将输出的序列表示,使用主题记忆网络编码潜在的主题表示;根据主题表示、推理与经过编码的序列表示进行匹配,形成最终编码表示,再使用解码器来生成初步输出序列;将输出的序列中每一个单词进行掩码喂入BERT并结合输入序列,使用基于transformer和LSTM的解码器来预测每个掩码位置的细化单词,实现微调。本发明通过双向上下文的BERT和LSTM层进行特征的深层捕捉,喂入掩码后的摘要,对参数进行微调,细化每一个摘要单词,使得生成更加流畅、信息量高的文本摘要。
-
公开(公告)号:CN115880723A
公开(公告)日:2023-03-31
申请号:CN202211623329.4
申请日:2022-12-16
Applicant: 南京信息工程大学
IPC: G06V40/10 , G06V10/764 , G06V10/82 , G06V10/774 , G06V10/80 , G06N3/0464 , G06N3/088
Abstract: 本发明公开一种基于样本加权的无监督多源域适应的行人重识别方法,该方法基于样本加权和多源域信息融合进行行人重识别,其包括如下步骤:将数据集划分为若干源域和一个目标域,并对各源域及目标域中的每个样本进行加权运算;其中,数据集由行人图片组成;构造域代理节点和图数据结构,对多源域的信息进行融合操作;基于源域和目标域的样本对识别模型进行训练,确定模型参数;将待识别的行人图片输入识别模型,得到分类识别结果。本发明的行人重识别方法能防止多个域因为域样本的大小不平衡而出现模型偏差的问题,缩小域间隔,将更多具有相似特征的图像分类到一起,提高相同类内图像的密度,从而达到更高的分类识别效果。
-
公开(公告)号:CN108509920B
公开(公告)日:2022-04-26
申请号:CN201810293102.5
申请日:2018-04-04
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种基于CNN的多patch多通道联合特征选择学习的人脸识别方法,属于人脸识别技术领域。该方法首先将原始人脸图像分割成多张子图像,每张子图像再分离成多张通道图像;然后为每张通道图像构建一个CNN网络模型,输入通道图像进行识别;接下来首先将同一子图像的多个通道神经网络进行连接,得到对应多张子图像的多个子图像神经网络,然后将多个子图像神经网络进行连接,作为最终的模型识别结果。本发明通过对现有卷积神经网络模型进行改进以及创新,从而达到优化和提升模型的效果,使得卷积神经网络模型的人脸识别能力更加精准,为其在日常生活、工业发展、科学研究等领域的广泛应用提供更有力的技术保障。
-
公开(公告)号:CN111611972A
公开(公告)日:2020-09-01
申请号:CN202010485899.6
申请日:2020-06-01
Applicant: 南京信息工程大学
Abstract: 本发明涉及一种基于多视图多任务集成学习的作物叶片种类识别方法,该方法选取叶片图像作为原始数据集,并进行特征提取,得到若干视图下的数据集;利用CNN模型作为基学习器,对若干视图下的数据集与原始数据集分别进行单独的集成学习;然后固定所有基学习器的参数,并去除掉基学习器中全连接分类器的最后一层,然后将所有模型的输出拼接起来,并添加新的分类器,对若干视图进行联合特征选择,使得其验证集准确率达到期望,得到多个视图下的模型;再利用多任务学习,对叶片种类进行识别。本发明强化了模型的准确度和泛化能力,整体上解决了传统深度学习模型训练数据不足,模型简单地堆叠深度导致的泛化能力弱的问题。
-
公开(公告)号:CN108446676A
公开(公告)日:2018-08-24
申请号:CN201810413049.8
申请日:2018-05-03
Applicant: 南京信息工程大学
IPC: G06K9/00
Abstract: 本发明公开了一种基于有序编码及多层随机投影的人脸图像年龄判别方法,属于人脸识别技术领域。本发明的方法采用双通道网络输入两张不同的照片分别经过多层ELM进行随机特征映射,并且通过高斯标签分布的分类模型输出编码,采用梯度下降法直接调节模型参数。本发明借用多层ELM以解决CNN复杂的参数修改问题,并且减少算法的过拟合现象。并且采用LDL编码进行输出,充分考虑到不同年龄的可能性,使算法更加合理和准确。此外,相比传统的单通道网络,双通道网络将不同年龄段的信息有序结合起来,克服了算法训练的随机性问题,提高了算法的泛化性能。
-
公开(公告)号:CN108171319A
公开(公告)日:2018-06-15
申请号:CN201711268262.6
申请日:2017-12-05
Applicant: 南京信息工程大学
IPC: G06N3/04
Abstract: 本发明提供的网络连接自适应深度卷积模型的构建方法,包括如下步骤:步骤一:对卷积神经网络中的权重向量进行正交化;步骤二:根据范数进行卷积神经网络中层与层之间连接的删除;步骤三:构建激活函数。本发明通过权重向量正交化减少了数据相关性;基于p范数进行卷积神经网络中层与层之间连接的删除,有效降低了深度卷积模型构建过程中过拟合的问题,并且实现了网络连接自适应;构建激活函数在不改变参数规模的前提下尽量概括数据信息,提高了建立深度卷积模型的准确性。
-
-
-
-
-
-
-
-
-