一种智能视频监控中行人的检测方法

    公开(公告)号:CN103106414A

    公开(公告)日:2013-05-15

    申请号:CN201210566809.1

    申请日:2012-12-24

    Abstract: 一种智能视频监控中行人的检测方法,涉及计算机视觉、模式识别和图像处理等领域。提供可快速定位视频中的人体目标,方便后续智能视频分析的一种智能视频监控中行人的检测方法。1)利用图像采集设备建立行人数据库,并对该数据集进行标注,数据采集通过视频采集设备获取,标注信息包括行人的大小和位置信息;2)采用支持向量机训练行人检测器模型,模型训练好之后,将参数存放在智能监控系统的存储单元中;3)提取输入图片的行人特征描述子;4)利用支持向量机对图片中的每个行人检测窗口进行分类,分类的结果送到视频输出单元中;5)对检测的窗口进行融合,获取最终的行人检测结果。

    一种视频监控中的人体行为识别方法

    公开(公告)号:CN103106394A

    公开(公告)日:2013-05-15

    申请号:CN201210566810.4

    申请日:2012-12-24

    CPC classification number: G06K9/00335

    Abstract: 一种视频监控中的人体行为识别方法,涉及计算机视觉领域。提供能够对视频中连续不同的行为进行识别的一种视频监控中的人体行为识别方法。包括检测和表示局部时空特征、计算局部时空特征与类别相关性、计算视频帧与类别相关性、检测和识别人体行为。基于该人体行为识别方法的人体行为监控系统包括视频采集单元、存储单元、特征抽取单元、相关性分析单元、行为识别单元、视频输出单元和预警单元。能够对视频中连续不同的行为进行识别。

    一种位姿优化方法、装置、设备及可读存储介质

    公开(公告)号:CN119941856A

    公开(公告)日:2025-05-06

    申请号:CN202510027266.3

    申请日:2025-01-08

    Applicant: 厦门大学

    Inventor: 盛意 苏松志

    Abstract: 本发明提供了一种位姿优化方法、装置、设备及可读存储介质,所述方法包括:在SplaTAM系统的追踪过程中,设定反向传播梯度下降算法的轮次L,利用反向传播梯度下降算法优化当前时刻相机的位姿,得到相机位姿优化结果;其中,在前K轮次中采用多尺度损失进行优化,在后L‑K轮次中采用深度和颜色损失进行优化,多尺度损失为关键点损失、物体级损失或场景级损失。本发明利用了多尺度损失函数来优化基于高斯点云的SLAM系统,用于提高相机位姿追踪的精度和鲁棒性。该系统通过整合不同尺度的信息,优化相机位姿的估计,尤其适用于相机运动剧烈或场景变化复杂的环境。

    基于两阶段聚类的联邦学习模型训练方法和存储设备

    公开(公告)号:CN113313266B

    公开(公告)日:2023-10-24

    申请号:CN202110661289.1

    申请日:2021-06-15

    Applicant: 厦门大学

    Inventor: 翁建庆 苏松志

    Abstract: 本发明涉及模型训练技术领域,特别涉及一种基于两阶段聚类提升联邦学习模型性能的训练方法和存储设备。所述一种基于两阶段聚类提升联邦学习模型性能的训练方法,包括步骤:获取每个客户在本地通过联邦学习训练好后的模型;通过K‑Center聚类方法将所有客户端分组为两个以上集群,每个集群对应一个不同的中央服务器;通过该步骤是对具有相似数据集的客户端的集群进行模型训练,减少了客户端数据分布的差异,加快收敛速度。将每个集群中的客户端随机分组为两个以上细粒度集群,采用预设算法对每个细粒度集群进行训练。通过进一步采用细粒度聚类方法来拉平了原始数据分布。通过以上步骤大大提高了联邦学习在Non‑IID环境下的模型性能。

    一种基于深度神经网络的人体行为识别方法

    公开(公告)号:CN109919031B

    公开(公告)日:2021-04-09

    申请号:CN201910097412.4

    申请日:2019-01-31

    Applicant: 厦门大学

    Abstract: 一种基于深度神经网络的人体行为识别方法,涉及人体行为识别领域。采集视频数据集,根据视频中的人体行为类别对视频进行切割,并赋予对应的类别标签;对视频数据进行抽帧和光流计算预处理,并对抽取的视频帧和光流图像赋予与其对应视频相同的类别标签;人体行为特征学习,使用深度卷积神经网络和双支流输入类残差长短期记忆单元循环神经网络LSTM模型学习视频长时序运动特征;根据学习到的人体行为识别特征,用Softmax层融合两条支流类残差循环神经网络学习到的长时序运动特征,并输出视频的识别类别。

    基于图像块轨迹的动态场景下视觉里程计鲁棒性提高方法

    公开(公告)号:CN118071788A

    公开(公告)日:2024-05-24

    申请号:CN202410209048.7

    申请日:2024-02-26

    Applicant: 厦门大学

    Inventor: 庄力建 苏松志

    Abstract: 本发明一种基于图像块轨迹的动态场景下视觉里程计鲁棒性提高方法,涉及视觉的运动估计技术领域,首先对于每个图像It随机采样M个宽度为p的图像块组成图像块集合#imgabs0#基于所有图像块和帧组成的图像块‑图获得图像块的轨迹τk;然后基于轨迹τk估计每个块的运动标签Mk;最后将带有运动标签Mk的块轨迹τk更新相机姿态Gt。本发明在图像中采样若干图像块,不对整张图像做稠密的光流估计,而是仅估计图像块的光流信息,降低了推理速度;用轨迹的形式来存储多帧的信息,通过分析帧间图像块的轨迹,能够更准确地预测图像块的运动状态,并对动态图像块的降权处理,提升了动态环境下视觉里程计的性能。

    一种动态新视角图像的合成方法、装置、设备及存储介质

    公开(公告)号:CN117974864A

    公开(公告)日:2024-05-03

    申请号:CN202410186360.9

    申请日:2024-02-20

    Applicant: 厦门大学

    Inventor: 陈文亮 苏松志

    Abstract: 本发明提供了一种动态新视角图像的合成方法、装置、设备及存储介质,通过先获取多视图视频,对多视图视频进行前景与背景分割,生成分割后的图像。处理分割后的图像,生成M个视角的相机位姿和N个时间帧运动物体的点云坐标,并生成运动物体的外包矩形框。以每一张训练图像的相机中心为出发点,朝每个像素发射射线,穿过外包矩形框的近平面和远平面,在每条射线上采样预设数量的采样点。将采样点的4D坐标分解为多个3D坐标,对每个3D坐标编码为哈希特征,通过MLP对哈希特征进行预测,生成采样点的密度。提取分割后的图像的小波高频系数,结合小波高频系数对当前渲染图像进行特征提取生成特征图。将采样点映射到相邻图像和对应的特征图,采用双线性插值的方式生成最终图像特征,通过MLP对最终图像特征进行预测,生成采样点的RGB颜色。采用体渲染的方式对采样点的RGB颜色和密度进行渲染,生成新视角的图像。解决了在捕捉复杂动态场景的外观细节方面不足、以及一致性渲染的准确性低的问题。

    面向目标物分类的模型自增强方法、介质和设备

    公开(公告)号:CN116977731A

    公开(公告)日:2023-10-31

    申请号:CN202310948846.7

    申请日:2023-07-31

    Applicant: 厦门大学

    Inventor: 苏松志 王婉

    Abstract: 本发明公开了面向目标物分类的模型自增强方法、介质和设备,所述方法包括:采用MLC算法对原始数据集进行训练,得到初始分类模型,原始数据集包括多张带有标签的第一样本图像;获取包含多张未带有标签的第二样本图像的第二训练集,将第二训练集输入至初始分类模型中进行计算,得到各个第二样本图像对应的初始分类标签信息;采用元损失校正算法训练噪声转移矩阵,对各个第二样本图像对应的初始分类标签信息进行校正,得到校正后的最终分类标签信息;根据最终分类标签信息对各个第二训练集中的第二样本图像进行打标,输出第三训练集。本申请通过元损失校正算法自动校正初始分类模型输出的第二样本图像的伪标签,提高了自动打标的准确性。

    人脸图像的超分辨率恢复方法、存储介质和电子设备

    公开(公告)号:CN115456873A

    公开(公告)日:2022-12-09

    申请号:CN202210993646.9

    申请日:2022-08-18

    Applicant: 厦门大学

    Abstract: 本发明提供了一种人脸图像的超分辨率恢复方法、存储介质和电子设备,所述方法包括:接收待处理的人脸图像;通过双重注意力模块对人脸图像进行第一处理,得到人脸图像的第一结构信息图像;通过人脸关键点激活模块对第一结构信息进行第二处理,激活人脸图像上的关键点信息,得到第二结构信息图像;通过频域感知分解判别器在频域空间对第二结构信息图像,识别第二结构信息图像和真实图像之间的频域样式的不同,并基于不同的频域样式得到相应的置信度信息。上述方案能够精细化恢复人脸的关键位置,进一步提升人脸图像上的结构信息,使得恢复人脸感官上的效果更好。

    一种基于两阶段聚类提升联邦学习模型性能的训练方法和存储设备

    公开(公告)号:CN113313266A

    公开(公告)日:2021-08-27

    申请号:CN202110661289.1

    申请日:2021-06-15

    Applicant: 厦门大学

    Inventor: 翁建庆 苏松志

    Abstract: 本发明涉及模型训练技术领域,特别涉及一种基于两阶段聚类提升联邦学习模型性能的训练方法和存储设备。所述一种基于两阶段聚类提升联邦学习模型性能的训练方法,包括步骤:获取每个客户在本地通过联邦学习训练好后的模型;通过K‑Center聚类方法将所有客户端分组为两个以上集群,每个集群对应一个不同的中央服务器;通过该步骤是对具有相似数据集的客户端的集群进行模型训练,减少了客户端数据分布的差异,加快收敛速度。将每个集群中的客户端随机分组为两个以上细粒度集群,采用预设算法对每个细粒度集群进行训练。通过进一步采用细粒度聚类方法来拉平了原始数据分布。通过以上步骤大大提高了联邦学习在Non‑IID环境下的模型性能。

Patent Agency Ranking