-
公开(公告)号:CN103778438A
公开(公告)日:2014-05-07
申请号:CN201410026849.6
申请日:2014-01-21
Applicant: 南京信息工程大学
Inventor: 刘茜
IPC: G06K9/62
Abstract: 本发明公开了基于核局部线性表示的分类方法,利用训练样本集识别测试样本所属的类别。首先对训练样本集和测试样本中的所有样本分别进行预处理,得到新的训练样本集和新的测试样本,然后从新的训练样本集中选取一部分距离新的测试样本最近的训练样本构成近邻训练样本集,各个样本类别的近邻训练样本构成子近邻训练样本集,再使用近邻训练样本集中的样本去线性表示新的测试样本,得到一组线性表示系数,并计算新的测试样本在各个子近邻训练样本集中的重构误差,最后将测试样本归为重构误差最小的子近邻训练样本集所对应的那一类。本发明基于核局部线性表示的分类方法相较于现有技术大大提高了识别精度。
-
公开(公告)号:CN119723456A
公开(公告)日:2025-03-28
申请号:CN202411836705.7
申请日:2024-12-13
Applicant: 南京信息工程大学
IPC: G06V20/52 , G06V40/10 , G06V10/772 , G06V10/82 , G06N3/0895 , G06N3/0464
Abstract: 本发明公开了基于SSD和半监督字典学习的行人检测与重识别方法,包括通过两台摄像机分别获取行人图像数据集1和行人图像数据集2,并对该数据集进行处理;对处理后的行人图像数据集1和行人图像数据集2进行划分;构建端到端的行人检测和重识别网络模型,该模型包括改进后的SSD512网络、行人特征提取子网络和半监督字典学习模块;训练端到端的行人检测和重识别网络模型,得到目标模型;将数据输入到目标模型中,得到行人检测和重识别结果。本发明实现了端到端的半监督行人检测与重识别,解决了由于检测到的定位边界框质量参差不齐、不同摄像机下的行人存在外观差异、周边环境差异等问题,提高行人检测和重识别方法的性能。
-
公开(公告)号:CN118918326A
公开(公告)日:2024-11-08
申请号:CN202410941236.9
申请日:2024-07-15
Applicant: 南京信息工程大学
IPC: G06V10/26 , G06V10/44 , G06V10/774 , G06V10/82 , G06V20/00 , G06N3/0464 , G06V10/80 , G06N3/084
Abstract: 本发明公开了一种基于双边融合网络的城市场景实时语义分割方法,包括:获取城市场景数据集并进行数据预处理,按比例将数据集划分成训练集、验证集和测试集;搭建双边融合网络;利用训练集、验证集对双边融合网络进行训练,获得最优网络模型;将测试集输入到最优网络模型,得到城市场景图像语义分割结果。本发明通过空间分支和语义分支分别获取图像的空间细节特征和高级语义信息,引入上下文信息聚合器捕获更大感受野的语义,使用语义细节融合模块更有效的融合低级空间细节特征和高级语义信息,实现了对图像空间细节和语义信息的有机结合,在提高模型分割精度的同时,保持了网络的实时性,确保实时语义分割中精度和推理速度的平衡。
-
公开(公告)号:CN118644821B
公开(公告)日:2024-11-08
申请号:CN202411125494.6
申请日:2024-08-16
Applicant: 南京信息工程大学
IPC: G06V20/52 , G06V10/80 , G06V10/44 , G06V10/52 , G06V10/766 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/0475 , G06N3/084 , G06N3/048
Abstract: 本申请涉及一种基于注意力特征融合与多列特征增强的人群计数方法。该方法包括:获取待识别人群图像,将待识别人群图像输入训练好的人群计数网络模型的概率图生成网络模块中进行处理,输出概率图,再将待识别人群图像和概率图输入训练好的人群计数网络模型的密度图回归网络模块中进行处理,输出密度图,密度图回归网络模块包括多列特征增强网络和双注意力特征融合网络;进而对密度图进行积分运算,获得待识别人群图像中的人群计数。由此,从而提高人群图像的计数准确性。
-
-
公开(公告)号:CN116740362A
公开(公告)日:2023-09-12
申请号:CN202311018487.1
申请日:2023-08-14
Applicant: 南京信息工程大学
IPC: G06V10/26 , G06V20/70 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于注意力的轻量化非对称场景语义分割方法及系统,构建包括:卷积下采样模块、基于通道注意力的深度非对称模块、并行下采样模块、基于空间注意力的金字塔池化模块和基于像素注意力的多尺度特征融合模块的实时场景语义分割网络。利用卷积下采样模块,并行下采样模块和基于通道注意力的深度非对称模块构建编码器,利用基于空间注意力的金字塔池化模块、基于像素注意力的多尺度特征融合模块、1×1卷积和双线性插值上采样构建解码器。采用深度非对称卷积代替普通卷积减少参数量,采用金字塔池化和特征融合模块提取上下文信息,减小上采样带来的误差,提高分割精度,加快预测速度。
-
公开(公告)号:CN113326738B
公开(公告)日:2023-07-07
申请号:CN202110491698.1
申请日:2021-05-06
Applicant: 南京信息工程大学
Inventor: 刘茜
Abstract: 本发明公开了一种基于深度网络和字典学习的行人目标检测与重识别方法,包括:1)使用不同场景的两个摄像机,构建行人数据集;2)为每个摄像机构建一个改进型SSD网络;3)对行人特征提取子网络输出的行人特征,构建共同的半监督迁移字典学习模块;4)利用行人数据集训练两个改进型SSD网络和半监督迁移字典学习模块,获得端到端的行人目标检测与重识别系统;5)将待识别的行人图像或视频输入行人目标检测与重识别系统,输出行人目标检测和重识别结果。本发明实现了行人目标检测与重识别的端到端系统模型,充分利用无标记训练样本参与深度网络和字典的学习,有效增强行人目标检测与重识别能力。
-
公开(公告)号:CN116310850A
公开(公告)日:2023-06-23
申请号:CN202310597005.6
申请日:2023-05-25
Applicant: 南京信息工程大学
IPC: G06V20/10 , G06V10/80 , G06V10/82 , G06V10/764 , G06N3/0464
Abstract: 本申请涉及一种基于改进型RetinaNet的遥感图像目标检测方法。该方法包括:将待检测遥感图像输入特征提取模块进行特征提取,生成不同尺度的初步图像特征,再输入第一注意力模块进行权重信息分析,生成不同尺度的初步权重图像特征输入特征融合模块进行特征融合,生成不同尺度的融合特征,再将不同尺度的初步图像特征和不同尺度的融合特征输入特征增强模块,生成不同尺度的增强融合特征输入第二注意力模块进行权重信息分析,生成不同尺度的增强权重图像特征输入卷积模块进行处理,生成不同尺度的最终图像特征,将不同尺度的最终图像特征输入分类与回归模块进行目标检测,输出目标检测结果。提高了遥感图像的目标检测的精度。
-
公开(公告)号:CN113177487A
公开(公告)日:2021-07-27
申请号:CN202110490325.2
申请日:2021-05-06
Applicant: 南京信息工程大学
Inventor: 刘茜
Abstract: 本申请涉及一种行人重识别方法、装置、计算机设备和存储介质。该方法包括:获取待比对摄像机拍摄的待识别行人图像;将待识别行人图像输入至待比对摄像机对应的识别模型进行识别,确定待识别行人图像中的行人类别,识别模型是预先基于半监督迁移字典学习的识别模型;根据待识别行人图像中的行人类别和目标行人类别,确定待比对摄像机中是否出现目标行人类别;在进行多个摄像机之间的迁移字典学习时,充分利用有标记训练样本监督地学习结构化的字典,充分利用无标记训练样本优化字典的稀疏表示性能,增强行人重识别能力,进而提高了行人重识别的准确度。
-
-
-
-
-
-
-
-
-