-
公开(公告)号:CN107016691A
公开(公告)日:2017-08-04
申请号:CN201710243141.X
申请日:2017-04-14
Applicant: 南京信息工程大学
Abstract: 本发明公开了基于超像素特征的运动目标检测方法,包括:利用SLIC0分割法对每帧图像进行超像素分割,并提取各超像素块的像素均值作为其超像素特征值;以初始种子点位置上的超像素特征值为此超像素块样本值,根据前N帧超像素块样本值构建各初始种子点位置上的超像素块的样本模型;提取新的一帧图像,计算其每个初始种子点上的超像素块与该种子点上超像素块的样本模型中每个样本之间的欧氏距离,若某超像素块与样本之间欧式距离小于距离阈值的总数小于匹配阈值,则判断该超像素块为前景块;此帧图像中所有的前景超像素块便组成了运动目标检测结果。本发明方法引入了超像素特征,获得良好的目标边缘信息,保证运动目标外观的完整性。
-
-
公开(公告)号:CN104881651A
公开(公告)日:2015-09-02
申请号:CN201510289260.X
申请日:2015-05-29
Applicant: 南京信息工程大学
CPC classification number: G06K9/00335 , G06K9/00718 , G06K9/6269
Abstract: 本发明公开了一种基于随机投影和Fisher向量的人物行为识别方法,采用随机投影定理的方法替代主成份分析法进行特征降维,以解决其时间消耗大,主成份保留不明确等问题,随机投影定理表明,通过一个压缩测量矩阵,可以把具有稀疏性质的原始信号投影到某个低维子空间上,该映射后的向量与原始高维特征向量间点距离基本保持不变,即整个压缩过程不会产生数据的曲解。此外不同于BoW模型的硬划分,本发明采用GMM—Fisher向量混合模型对轨迹特征向量进行软划分,它融合了Fisher核生成模式和判别模式的特点,不仅能计算出每个特性描述子出现的频率,还能从统计学的意义上描述这些特征描述子的概率分布情况,既丰富了行为动作的特征表达又提高了行为识别的效率。
-
公开(公告)号:CN104076331A
公开(公告)日:2014-10-01
申请号:CN201410273464.X
申请日:2014-06-18
Applicant: 南京信息工程大学
IPC: G01S5/22
CPC classification number: G01S5/22
Abstract: 本发明公开了一种七元麦克风阵列的声源定位方法,该方法建立了七元麦克风阵列模型与室内声场模型;利用该麦克风阵列接收室内声源语音信号,对接收的语音信号进行采集、滤波、加窗、谱减、倒谱处理;再利用相位变换加权广义互相关方法GCC-PHAT,得各麦克风之间的时间延迟;运用三维空间定位方法与坐标旋转数字式计算机方法,确定声源位置。本发明在混响、噪声等干扰信号存在的室内环境下,能准确确定声源位置,实时性强、准确性高,在语音信号处理领域有广泛的应用。
-
公开(公告)号:CN115546252A
公开(公告)日:2022-12-30
申请号:CN202211344364.2
申请日:2022-10-31
Applicant: 南京信息工程大学
IPC: G06T7/246 , G06V20/40 , G06V10/40 , G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于互相关匹配增强孪生网络的目标跟踪方法及系统,包括:对所采集的待跟踪目标的视频序列进行裁剪,获得所有帧图像的模板图像和搜索图像;将所述模板图像和搜索图像输入至构建并训练好的互相关匹配增强孪生网络中,提取模板图像和搜索图像的模板特征和搜索特征;对模板特征和搜索特征进行互相关匹配得到互相关特征;对模板图像进行边界框信息编码得到边界框编码特征;对互相关特征与边界框编码特征的融合特征进行分类计算和回归计算,得到相应的分类得分图和回归预测图;根据分类得分图中响应值最大的位置,结合回归预测图的偏移量,获得目标在视频序列帧上的最终位置。本发明对复杂场景变化跟踪的适应能力强且精度高。
-
公开(公告)号:CN115116032A
公开(公告)日:2022-09-27
申请号:CN202210681167.3
申请日:2022-06-15
Applicant: 南京信息工程大学
IPC: G06V20/58 , G06V10/82 , G06V10/774 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种基于改进YOLOv5的交通标志检测方法,基于YOLOv5神经网络、以及包含标签的交通图像的交通标志数据集。在YOLOv5神经网络的主干部分添加特征增强FEM模块和区域上下文模块,在输出端部分之后增加CIoU‑NMS模块,依次顺序连接改进YOLOv5神经网络主干部分、颈部、改进YOLOv5神经网络输出部分,构建并训练以交通标志样本图像为输入、交通标志样本图像所对应的真值标签为输出改进YOLOv5的交通标志检测模型。应用交通标志检测模型,获得目标交通标志图像对应的标签。本发明提出了新的区域上下文模块和特征增强模块,用在YOLOv5检测算法中,交通标志检测性能有所提升。
-
公开(公告)号:CN110569706A
公开(公告)日:2019-12-13
申请号:CN201910546908.5
申请日:2019-06-25
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种基于时间和空间网络的深度集成目标跟踪算法,利用VGG-16网络提取深度特征并得到特征映射图,构建由相关滤波网络、时间网络以及空间网络构成的深度网络,将特征映射图送入由相关滤波网络、时间网络以及空间网络连接成的深度网络中,同时训练模型,直到收敛为止,以前一帧预测的目标位置为中心在当前帧的图片中提取搜索块,用VGG-16网络提取搜索块的特征送入与之对应训练好的模型中来生成响应映射,利用自适应权重的集成学习算法融合所有弱跟踪器得到最终的目标位置,采用尺度估计算法对目标大小进行预测,利用当前帧的搜索块和预测值组成训练对,输入到模型中进行在线更新。可以进一步提高算法的精确度。
-
公开(公告)号:CN110175649A
公开(公告)日:2019-08-27
申请号:CN201910451171.9
申请日:2019-05-28
Applicant: 南京信息工程大学
IPC: G06K9/62
Abstract: 本发明提出了一种关于深度特征与重新检测的快速多尺度估计目标跟踪算法。通过深度学习的方法来表示目标的特征,提高了目标的特征表达能力。在跟踪阶段,提取不同的尺度图像块的特征时,通过PCA降维,可以减少计算量,提高整体的计算速度。在峰值旁瓣比(PSR)和置信度平滑约束(SCCM)两个判别指标的基础上,提出一种新的检测指标,从而可以更加准确地度量当前帧的跟踪可靠度。若当前帧的可靠度较低,则通过Edgeboxes的方法产生一系列目标候选框从而进行重新检测。
-
公开(公告)号:CN109801310A
公开(公告)日:2019-05-24
申请号:CN201811403020.8
申请日:2018-11-23
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种方位和尺度判别深度网络的目标跟踪方法,包括以下步骤:(1),预训练网络;步骤(2),方位信息分类;步骤(3),滑窗操作;步骤(4),在线微调;步骤(5),丢失重新检测。本发明在深度学习网络框架下加入了方向信息分类和正负样本分类,使得深度网络计算量低,速度较快;同时通过在线微调网络参数策略,当目标发生形变的时候,使网络适应目标不同时期的形变,依然可以很好地完成跟踪任务;另外,在跟踪时,引入重检测策略,对目标跟踪中目标丢失的情况也能很好处理。
-
公开(公告)号:CN106557774A
公开(公告)日:2017-04-05
申请号:CN201510633918.4
申请日:2015-09-29
Applicant: 南京信息工程大学
IPC: G06K9/62
CPC classification number: G06K9/6256
Abstract: 本发明公开了一种多通道核相关滤波的实时跟踪方法,该方法包括:训练阶段:通过岭回归方法对上一帧目标信息进行处理,获得滤波模板;检测阶段:用获得的滤波模板对当前帧的图像进行检测,输出滤波响应;更新阶段:对滤波模板和目标外观进行实时更新。本发明的方法利用核函数融合多通道特征,克服了多通道特征的选择局限。并通过核函数将岭回归的线性优化问题转换为高维空间的非线性优化问题,从而构建一个鲁棒性更好的滤波模板,以适应目标在跟踪过程中的各种场景变化,提高跟踪器的性能,同时,绕过抽取大量样本和构建复杂外观模型的过程,使跟踪器的速度被大幅度提升,能够满足现实世界的跟踪需求。
-
-
-
-
-
-
-
-
-