一种智能视频监控中行人的检测方法

    公开(公告)号:CN103106414A

    公开(公告)日:2013-05-15

    申请号:CN201210566809.1

    申请日:2012-12-24

    Abstract: 一种智能视频监控中行人的检测方法,涉及计算机视觉、模式识别和图像处理等领域。提供可快速定位视频中的人体目标,方便后续智能视频分析的一种智能视频监控中行人的检测方法。1)利用图像采集设备建立行人数据库,并对该数据集进行标注,数据采集通过视频采集设备获取,标注信息包括行人的大小和位置信息;2)采用支持向量机训练行人检测器模型,模型训练好之后,将参数存放在智能监控系统的存储单元中;3)提取输入图片的行人特征描述子;4)利用支持向量机对图片中的每个行人检测窗口进行分类,分类的结果送到视频输出单元中;5)对检测的窗口进行融合,获取最终的行人检测结果。

    一种视频监控中的人体行为识别方法

    公开(公告)号:CN103106394A

    公开(公告)日:2013-05-15

    申请号:CN201210566810.4

    申请日:2012-12-24

    CPC classification number: G06K9/00335

    Abstract: 一种视频监控中的人体行为识别方法,涉及计算机视觉领域。提供能够对视频中连续不同的行为进行识别的一种视频监控中的人体行为识别方法。包括检测和表示局部时空特征、计算局部时空特征与类别相关性、计算视频帧与类别相关性、检测和识别人体行为。基于该人体行为识别方法的人体行为监控系统包括视频采集单元、存储单元、特征抽取单元、相关性分析单元、行为识别单元、视频输出单元和预警单元。能够对视频中连续不同的行为进行识别。

    一种位姿优化方法、装置、设备及可读存储介质

    公开(公告)号:CN119941856A

    公开(公告)日:2025-05-06

    申请号:CN202510027266.3

    申请日:2025-01-08

    Applicant: 厦门大学

    Inventor: 盛意 苏松志

    Abstract: 本发明提供了一种位姿优化方法、装置、设备及可读存储介质,所述方法包括:在SplaTAM系统的追踪过程中,设定反向传播梯度下降算法的轮次L,利用反向传播梯度下降算法优化当前时刻相机的位姿,得到相机位姿优化结果;其中,在前K轮次中采用多尺度损失进行优化,在后L‑K轮次中采用深度和颜色损失进行优化,多尺度损失为关键点损失、物体级损失或场景级损失。本发明利用了多尺度损失函数来优化基于高斯点云的SLAM系统,用于提高相机位姿追踪的精度和鲁棒性。该系统通过整合不同尺度的信息,优化相机位姿的估计,尤其适用于相机运动剧烈或场景变化复杂的环境。

    基于两阶段聚类的联邦学习模型训练方法和存储设备

    公开(公告)号:CN113313266B

    公开(公告)日:2023-10-24

    申请号:CN202110661289.1

    申请日:2021-06-15

    Applicant: 厦门大学

    Inventor: 翁建庆 苏松志

    Abstract: 本发明涉及模型训练技术领域,特别涉及一种基于两阶段聚类提升联邦学习模型性能的训练方法和存储设备。所述一种基于两阶段聚类提升联邦学习模型性能的训练方法,包括步骤:获取每个客户在本地通过联邦学习训练好后的模型;通过K‑Center聚类方法将所有客户端分组为两个以上集群,每个集群对应一个不同的中央服务器;通过该步骤是对具有相似数据集的客户端的集群进行模型训练,减少了客户端数据分布的差异,加快收敛速度。将每个集群中的客户端随机分组为两个以上细粒度集群,采用预设算法对每个细粒度集群进行训练。通过进一步采用细粒度聚类方法来拉平了原始数据分布。通过以上步骤大大提高了联邦学习在Non‑IID环境下的模型性能。

    一种基于深度神经网络的人体行为识别方法

    公开(公告)号:CN109919031B

    公开(公告)日:2021-04-09

    申请号:CN201910097412.4

    申请日:2019-01-31

    Applicant: 厦门大学

    Abstract: 一种基于深度神经网络的人体行为识别方法,涉及人体行为识别领域。采集视频数据集,根据视频中的人体行为类别对视频进行切割,并赋予对应的类别标签;对视频数据进行抽帧和光流计算预处理,并对抽取的视频帧和光流图像赋予与其对应视频相同的类别标签;人体行为特征学习,使用深度卷积神经网络和双支流输入类残差长短期记忆单元循环神经网络LSTM模型学习视频长时序运动特征;根据学习到的人体行为识别特征,用Softmax层融合两条支流类残差循环神经网络学习到的长时序运动特征,并输出视频的识别类别。

    基于骨骼数据的视频动作分类方法、装置、设备及介质

    公开(公告)号:CN117935364A

    公开(公告)日:2024-04-26

    申请号:CN202410124120.6

    申请日:2024-01-30

    Applicant: 厦门大学

    Inventor: 陈涵艺 苏松志

    Abstract: 本发明提供了一种基于骨骼数据的视频动作分类方法、装置、设备及介质,先获取待分类的视频信息,并基于双流放大模块对所述待分类的视频信息进行采样分解,以生成RGB信息流和骨骼信息流,接着,调用时序感知网络对所述RGB信息流进行特征提取,以生成所述待分类的视频信息的色彩特征;同时,对所述骨骼信息流进行转化成为三维数据,并调用图卷积网络对进行时序交叉后的所述三维数据进行处理,以生成所述待分类的视频信息的骨骼特征;最后,对所述色彩特征和所述骨骼特征进行融合,并根据所述融合结果生成视频信息的动作分类结果。解决了现有技术中通过色彩信息进行分类会受光照影响而出现分类失误的问题。

    一种面向在线考试答卷文档图像的一致性检测方法和存储设备

    公开(公告)号:CN112818797B

    公开(公告)日:2024-03-01

    申请号:CN202110102061.9

    申请日:2021-01-26

    Applicant: 厦门大学

    Abstract: 本发明涉及图像处理技术领域,特别涉及一种面向在线考试答卷文档图像的一致性检测方法和存储设备。所述一种面向在线考试答卷文档图像的一致性检测方法,包括步骤:获取第一图像和第二图像;定位两图像的奇异点位置,并根据奇异点位置对两个图像进行像素级对齐;截取第一图像的第一目标块,截取所述第二图像的第二目标块;比对第一目标块与第二目标块是否一致,若一致,则判定所述第一图像和所述第二图像一致。以上步骤中利用奇异点来实现第一图像和第二图像的像素级对齐,并且用来比对的目标块的奇异点数均不小于预设个数,确保了用于比对的目标块上信息的丰富性,确保了图像比对结果的准确性。(56)对比文件Geng Li-chuan;Su Song-zhi etal..Perspective invariant binary featuredescriptor based image matchingalgorithm《.Journal on Communications》.2015,第36卷(第4期),正文全文.赵琪 等.基于奇异点区域方向场的指纹检索《.微计算机信息》.2010,正文第1页右列第2段,第3页第2节.

    一种业务流程异常节点溯源方法

    公开(公告)号:CN112800282B

    公开(公告)日:2022-11-08

    申请号:CN202110054367.1

    申请日:2021-01-15

    Applicant: 厦门大学

    Abstract: 一种业务流程异常节点溯源方法,涉及流程图的构建与查找。包括以下步骤:1)通过数据仿真构建包含属性图信息的业务流程图;业务流程图中包括节点、节点属性、节点关系,属性图包含节点属性的转换关系;2)根据业务流程图和属性图中节点的属性数据流动关系,结合深度优先遍历搜索算法,基于属性图约束对业务流程图进行剪枝优化,将与异常节点路径上不相关的支路去除,给出起始溯源的具体属性,沿着该属性的方向逆向查找异常点,完成业务流程异常节点溯源。加快网络对异常节点的搜索速度,提升搜索效率,可实现高效异常逆向溯源搜索,为流程推进提供有力保障具有实际意义。

    一种遥感图像下的飞机检测方法及存储介质

    公开(公告)号:CN110991305A

    公开(公告)日:2020-04-10

    申请号:CN201911183503.6

    申请日:2019-11-27

    Applicant: 厦门大学

    Abstract: 本发明涉及一种遥感图像下的飞机检测方法及存储介质,所述方法包括以下步骤:根据输入待检测遥感图像,构造图像金字塔;将图像金字塔的每一层依次作为第一阶段神经网络的输入,得到每一层对应的输出结果;对于每一层对应的输出结果,将其区域置信度低于第一预设阈值的区域全部忽略,然后对剩下的区域进行执行非极大值抑制;将所有层的输出结果进行合并后,执行非极大值抑制,得到第一阶段输出结果;将第一阶段输出结果作为第二阶段神经网络的输入,得到第二阶段输出结果;将第二阶段输出结果中的区域置信度小于第二预设阈值的区域忽略,对剩下的区域进行非极大值抑制,得到最终输出结果。达到与深层神经网络相同的检测精度,将检测速度提升2-3倍。

    一种基于球面对齐估计的全景图像拼接方法及存储设备

    公开(公告)号:CN109829851A

    公开(公告)日:2019-05-31

    申请号:CN201910042518.4

    申请日:2019-01-17

    Applicant: 厦门大学

    Inventor: 邓海林 苏松志

    Abstract: 本发明涉及图像处理技术领域,特别涉及一种基于球面对齐估计的全景图像拼接方法及存储设备。所述一种基于球面对齐估计的全景图像拼接方法,包括步骤:获取输入图像,并将所述输入图像映射至统一的立方体网格展开图像面上;通过局部加权,计算每一个球面网格顶点的局部旋转矩阵,根据所述局部旋转矩阵得到局部对齐后的球面网格位置;对局部对齐后的球面网格位置通过纹理映射得到局部对齐后的映射图像。该拼接方法,可以在保证全景图像球面一致性的前提下,即使相机之间存在一定的视差,亦可极大程度的减少全景图像拼接中的拼接错位问题。

Patent Agency Ranking