人脸图像的超分辨率恢复方法、存储介质和电子设备

    公开(公告)号:CN115456873A

    公开(公告)日:2022-12-09

    申请号:CN202210993646.9

    申请日:2022-08-18

    Applicant: 厦门大学

    Abstract: 本发明提供了一种人脸图像的超分辨率恢复方法、存储介质和电子设备,所述方法包括:接收待处理的人脸图像;通过双重注意力模块对人脸图像进行第一处理,得到人脸图像的第一结构信息图像;通过人脸关键点激活模块对第一结构信息进行第二处理,激活人脸图像上的关键点信息,得到第二结构信息图像;通过频域感知分解判别器在频域空间对第二结构信息图像,识别第二结构信息图像和真实图像之间的频域样式的不同,并基于不同的频域样式得到相应的置信度信息。上述方案能够精细化恢复人脸的关键位置,进一步提升人脸图像上的结构信息,使得恢复人脸感官上的效果更好。

    一种基于两阶段聚类提升联邦学习模型性能的训练方法和存储设备

    公开(公告)号:CN113313266A

    公开(公告)日:2021-08-27

    申请号:CN202110661289.1

    申请日:2021-06-15

    Applicant: 厦门大学

    Inventor: 翁建庆 苏松志

    Abstract: 本发明涉及模型训练技术领域,特别涉及一种基于两阶段聚类提升联邦学习模型性能的训练方法和存储设备。所述一种基于两阶段聚类提升联邦学习模型性能的训练方法,包括步骤:获取每个客户在本地通过联邦学习训练好后的模型;通过K‑Center聚类方法将所有客户端分组为两个以上集群,每个集群对应一个不同的中央服务器;通过该步骤是对具有相似数据集的客户端的集群进行模型训练,减少了客户端数据分布的差异,加快收敛速度。将每个集群中的客户端随机分组为两个以上细粒度集群,采用预设算法对每个细粒度集群进行训练。通过进一步采用细粒度聚类方法来拉平了原始数据分布。通过以上步骤大大提高了联邦学习在Non‑IID环境下的模型性能。

    一种检测在线考试中考生双耳佩戴违禁物品的方法和存储设备

    公开(公告)号:CN112883814A

    公开(公告)日:2021-06-01

    申请号:CN202110101838.X

    申请日:2021-01-26

    Applicant: 厦门大学

    Abstract: 本发明涉及图像处理技术领域,特别涉及一种检测在线考试中考生双耳佩戴违禁物品的方法和存储设备。所述一种检测在线考试中考生双耳佩戴违禁物品的方法,包括步骤:通过预定义检测窗口获取目标画面;对所述目标画面进行预处理操作;对预处理操作后的目标画面进行待检测目标定位,若定位到待检测目标,则通过预设矩形框提取待检测目标,所述待检测目标包括:耳朵,获取到含有耳朵及耳朵周围图像的待检测画面;对所述待检测画面进行特征加强操作,输入特征加强操作后的待检测画面至深度分类网络,输出判断结果,进而根据判断结果辅助知道考生是否违规。

    一种适用于在线监考场景下的智能姿态判别方法和存储设备

    公开(公告)号:CN112818796A

    公开(公告)日:2021-05-18

    申请号:CN202110101837.5

    申请日:2021-01-26

    Applicant: 厦门大学

    Abstract: 本发明涉及计算机视觉算法技术领域,具体为一种适用于在线监考场景下的智能姿态判别方法和存储设备。所述一种适用于在线监考场景下的智能姿态判别方法,包括步骤:获取考生在线考试视频图像帧数据,并对所述视频图像帧数据进行处理得人体关键点坐标;根据所述人体关键点坐标得考生身体姿态的多维向量;输入所述多维向量至预先建立好的姿态判别模型中,根据预先设置的阈值对该考生的身体姿态是否存在异常进行判断。整个过程中,无需人工参与,即可自动化对学生的身体姿态进行判断,进而辅助判断学生是否存在作弊行为等,大大节约人力,减少人为的漏判,使得在线监考可得到更大的推广。

    一种融合双通道的三层架构数学公式识别方法、系统和存储设备

    公开(公告)号:CN112183544A

    公开(公告)日:2021-01-05

    申请号:CN202011046709.7

    申请日:2020-09-29

    Applicant: 厦门大学

    Inventor: 胡健 苏松志

    Abstract: 本发明涉及数学公式识别技术领域,特别涉及一种融合双通道的三层架构数学公式识别方法、系统和存储设备。所述一种融合双通道的三层架构数学公式识别方法,包括步骤:通过编码层对输入图片进行特征提取,所述特征包括:区域视觉信息;通过注意力层捕获区域视觉信息的上下文,生成context向量;通过解码层对所述context向量进行解码,生成公式对应的数学标记语言文件。通过编码层、注意力层和解码层三个层的上述操作,可获得精准度更高的数学公式。

    一种位姿优化方法、装置、设备及可读存储介质

    公开(公告)号:CN119941856A

    公开(公告)日:2025-05-06

    申请号:CN202510027266.3

    申请日:2025-01-08

    Applicant: 厦门大学

    Inventor: 盛意 苏松志

    Abstract: 本发明提供了一种位姿优化方法、装置、设备及可读存储介质,所述方法包括:在SplaTAM系统的追踪过程中,设定反向传播梯度下降算法的轮次L,利用反向传播梯度下降算法优化当前时刻相机的位姿,得到相机位姿优化结果;其中,在前K轮次中采用多尺度损失进行优化,在后L‑K轮次中采用深度和颜色损失进行优化,多尺度损失为关键点损失、物体级损失或场景级损失。本发明利用了多尺度损失函数来优化基于高斯点云的SLAM系统,用于提高相机位姿追踪的精度和鲁棒性。该系统通过整合不同尺度的信息,优化相机位姿的估计,尤其适用于相机运动剧烈或场景变化复杂的环境。

    基于两阶段聚类的联邦学习模型训练方法和存储设备

    公开(公告)号:CN113313266B

    公开(公告)日:2023-10-24

    申请号:CN202110661289.1

    申请日:2021-06-15

    Applicant: 厦门大学

    Inventor: 翁建庆 苏松志

    Abstract: 本发明涉及模型训练技术领域,特别涉及一种基于两阶段聚类提升联邦学习模型性能的训练方法和存储设备。所述一种基于两阶段聚类提升联邦学习模型性能的训练方法,包括步骤:获取每个客户在本地通过联邦学习训练好后的模型;通过K‑Center聚类方法将所有客户端分组为两个以上集群,每个集群对应一个不同的中央服务器;通过该步骤是对具有相似数据集的客户端的集群进行模型训练,减少了客户端数据分布的差异,加快收敛速度。将每个集群中的客户端随机分组为两个以上细粒度集群,采用预设算法对每个细粒度集群进行训练。通过进一步采用细粒度聚类方法来拉平了原始数据分布。通过以上步骤大大提高了联邦学习在Non‑IID环境下的模型性能。

    一种基于深度神经网络的人体行为识别方法

    公开(公告)号:CN109919031B

    公开(公告)日:2021-04-09

    申请号:CN201910097412.4

    申请日:2019-01-31

    Applicant: 厦门大学

    Abstract: 一种基于深度神经网络的人体行为识别方法,涉及人体行为识别领域。采集视频数据集,根据视频中的人体行为类别对视频进行切割,并赋予对应的类别标签;对视频数据进行抽帧和光流计算预处理,并对抽取的视频帧和光流图像赋予与其对应视频相同的类别标签;人体行为特征学习,使用深度卷积神经网络和双支流输入类残差长短期记忆单元循环神经网络LSTM模型学习视频长时序运动特征;根据学习到的人体行为识别特征,用Softmax层融合两条支流类残差循环神经网络学习到的长时序运动特征,并输出视频的识别类别。

    一种融合双通道的三层架构数学公式识别方法、系统和存储设备

    公开(公告)号:CN112183544B

    公开(公告)日:2024-09-13

    申请号:CN202011046709.7

    申请日:2020-09-29

    Applicant: 厦门大学

    Inventor: 胡健 苏松志

    Abstract: 本发明涉及数学公式识别技术领域,特别涉及一种融合双通道的三层架构数学公式识别方法、系统和存储设备。所述一种融合双通道的三层架构数学公式识别方法,包括步骤:通过编码层对输入图片进行特征提取,所述特征包括:区域视觉信息;通过注意力层捕获区域视觉信息的上下文,生成context向量;通过解码层对所述context向量进行解码,生成公式对应的数学标记语言文件。通过编码层、注意力层和解码层三个层的上述操作,可获得精准度更高的数学公式。

    跨模态检索的视觉位置识别方法、存储介质和电子设备

    公开(公告)号:CN115457125A

    公开(公告)日:2022-12-09

    申请号:CN202210993635.0

    申请日:2022-08-18

    Applicant: 厦门大学

    Inventor: 黄锐 苏松志

    Abstract: 本发明提供了一种跨模态检索的视觉位置识别方法、存储介质和电子设备,所述方法包括:以离线方式一次性构建3D点云地图数据库,将数据库中密集的点云表示转换为轻量级结构形式的点云,并利用注意力机制为轻量级点云融合上下文信息,以得到3D点云地图数据库的全局特征;以在线方式实时获得待查询图像,通过轻量型图像骨干网络提取待查询的2D图像的全局特征;计算3D点云地图数据库的全局特征和2D图像的全局特征的欧氏距离,并建立两者的对应关系。而后可以通过2D待查询图像的特征去实时检索以轻量级结构表示的3D点云数据库特征,以获得与待查询图像处于同一地理位置的点云图,能够快速地提取查询图像的特征信息。

Patent Agency Ranking