-
公开(公告)号:CN109492602A
公开(公告)日:2019-03-19
申请号:CN201811393385.7
申请日:2018-11-21
Applicant: 华侨大学
Abstract: 本发明公开了一种基于人体肢体语言的工序计时方法及系统。其中,所述方法包括:获取一个工人生产过程中的视频数据,进而从该视频数据中识别出该工人生产过程中的肢体语言信息,进而根据该视频数据和该肢体语言信息,建立基于该视频数据的视频帧与该肢体语言信息的二维坐标图,进而对该二维坐标图进行图像去噪,进而对该经图像去噪后的二维坐标图中表示肢体语言信息的坐标数据进行标注,标注出峰值,进而根据该标注出的峰值,取两个峰值区间为一个工序周期,对该工人生产过程中的工序时间进行统计,得到该工人生产过程中的工序计时。通过上述方式,能够实现无需人工参与可以自动对工人生产过程中的工序进行计时,使得工序计时更加客观和准确。
-
公开(公告)号:CN109344874A
公开(公告)日:2019-02-15
申请号:CN201811012952.X
申请日:2018-08-31
Applicant: 华侨大学
Abstract: 本发明公开了一种基于深度学习的染色体自动分析方法及系统,可以采用多层次处理,分层处理染色体的独立形态和重叠形态,并对染色体位置坐标、分类标签、分类置信度进行聚类分析输出核型图。通过上述方式,能够采用基于深度学习的染色体分割方法,不依赖特定染色体形态模式,具有较高的泛化能力,能够采用基于深度学习的染色体分类方法,兼顾染色体全局形态和带纹特征,提高分类准确率,能够采用多尺度处理,对待检测图像利用更加充分,有效提高在染色体重叠,粘连情况下的分割效果。
-
公开(公告)号:CN119848427A
公开(公告)日:2025-04-18
申请号:CN202411967907.5
申请日:2024-12-30
Applicant: 华侨大学 , 厦门万宾科技有限公司
IPC: G06F18/10 , G06F18/213 , G06F18/214 , G06F18/2431 , G06F18/243 , G06N5/01
Abstract: 本发明公开了一种基于改进C4.5的真空干泵多故障预测方法及系统,方法包括:使用改进C4.5算法构建决策树模型并利用真空干泵的全寿命振动信号数据进行训练,得到训练好的多故障预测模型;获取真空干泵实时运行监测的振动信号数据,并对所述数据进行预处理;将预处理后的振动信号数据输入训练好的多故障预测模型,以预测振动信号数据中是否出现故障,并输出故障预测结果,所述预测结果包括故障类型及故障发生时间。本发明通过透明的决策过程、实时更新、精细特征提取和强大的多故障分类能力,解决了现有技术的不足,能够有效预测真空干泵的多种重叠故障,为设备维护提供及时的决策支持。
-
公开(公告)号:CN118015708A
公开(公告)日:2024-05-10
申请号:CN202410411050.2
申请日:2024-04-08
Applicant: 华侨大学
IPC: G06V40/20 , G06V20/40 , G06V10/44 , G06V10/62 , G06V10/764 , G06V10/766 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0985 , A63B24/00 , A63B69/00
Abstract: 一种基于裁判分数学习的跳水运动质量评估方法、装置和设备,涉及动作质量评估技术领域。方法包含S1、获取待评估视频。S2、根据待评估视频进行采样,获取待评估视频帧序列。S3、从训练集中选取对比视频帧序列。S4、通过空间特征编码器ViT分别进行编码,获取两个图像特征序列。S5、通过时序特征编码器TE分别进行编码,获取待评估视频级特征序列和对比视频级特征序列。S6、将两个特征序列输入裁判分数学习评估网络,获取动作质量得分。裁判分数学习评估网络利用基于交叉注意力机制的交叉特征融合网络和基于Transformer解码器的对比动作特征解码器来学习生成具有差异性的裁判分数特征,然后采用分数预测网络根据裁判分数特征预测动作质量得分。
-
公开(公告)号:CN113642420B
公开(公告)日:2024-04-16
申请号:CN202110843573.0
申请日:2021-07-26
Applicant: 华侨大学
Abstract: 本发明提供了一种唇语的识别方法、装置及设备,包括:获取视频数据,并对所述视频数据进行处理,以获得唇部图像序列;对所述图像序列进行双向时序的特征提取,生成所述唇部图像序列的表观特征;调用LSTM模型,对所述表观特征的变化进行镜头转换的边界检测并生成检测结果,根据所述检测结果初始化所述LSTM模型的隐含层和记忆层;提取所述隐含层的编码特征,并根据所述编码特征获取单词预测序列。减少现有的唇语识别算法的复杂度、时间复杂度的同时保持较高的准确率。
-
公开(公告)号:CN117115573B
公开(公告)日:2024-01-05
申请号:CN202311388102.0
申请日:2023-10-25
Applicant: 华侨大学
IPC: G06V10/764 , G06V10/26 , G06V10/80 , G06V10/774 , G06V10/52
Abstract: 本发明提供了一种有毒生物图像分类识别方法、装置、设备及存储介质,先通过获取图像样本,调用基于均衡采样策略和逆向采样策略交叉训练过的分类模型基于所述图像样本的分辨率进行分割成多组切块;接着,基于特征提取的阶段调整所述多组切块的数量以及采样频率进行特征提取,以生成不同阶段的多尺度特征图;最后,对所述不同阶段的多尺度特征图进行融合后通过融合特征分类器进行预测,以生成所述图像样本的预测结果,其中,预测结果为所述图像样本是否为有毒生物,通过使用自适应样本平衡采样训练策略,缓解训练集类别样本数量不均衡造成的影响,有效的提高了在对有毒生物识别时的识别率。
-
公开(公告)号:CN117095244B
公开(公告)日:2024-01-05
申请号:CN202311349539.3
申请日:2023-10-18
Applicant: 华侨大学
IPC: G06V10/764 , G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/084
Abstract: 本发明提供了一种红外目标识别方法、装置、设备及介质,包括获取红外摄像机采集到的红外图片数据集;调用训练好的YOLOv5目标识别模型对红外图片数据集的红外图片进行识别处理,生成输出特征张量和模型识别精度;调用注意力模块对输出特征张量和模型识别精度进行过滤处理,生成三个不同尺寸的过滤特征图;小目标识别头、中目标识别头和大目标识别头分别依照对应的不同尺寸的过滤特征图,对待识别物体进行识别。此外,现有的基于领域自适应的红外目标识别技术存在生成的图像质量不够稳定的问题。
-
公开(公告)号:CN117095244A
公开(公告)日:2023-11-21
申请号:CN202311349539.3
申请日:2023-10-18
Applicant: 华侨大学
IPC: G06V10/764 , G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/084
Abstract: 本发明提供了一种红外目标识别方法、装置、设备及介质,包括获取红外摄像机采集到的红外图片数据集;调用训练好的YOLOv5目标识别模型对红外图片数据集的红外图片进行识别处理,生成输出特征张量和模型识别精度;调用注意力模块对输出特征张量和模型识别精度进行过滤处理,生成三个不同尺寸的过滤特征图;小目标识别头、中目标识别头和大目标识别头分别依照对应的不同尺寸的过滤特征图,对待识别物体进行识别。此外,现有的基于领域自适应的红外目标识别技术存在生成的图像质量不够稳定的问题。
-
公开(公告)号:CN117058472A
公开(公告)日:2023-11-14
申请号:CN202311316106.8
申请日:2023-10-12
Applicant: 华侨大学
IPC: G06V10/764 , G06V10/82 , G06V10/25 , G06V10/766 , G06V10/80 , G06N3/0464 , G06N3/045 , G06N3/08
Abstract: 本发明提供了基于自注意力机制的3D目标检测方法、装置、设备,涉及人工智能和计算机视觉技术领域,针对在两阶段网络模型中第一阶段得到感兴趣区域后点与点之间的信息密度不高问题,提出了一种基于自注意力机制的3D目标检测算法,通过增强点与点之间的交互信息密度,进而提高感受野的覆盖范围。在KITTI数据集上的实验证明,该方法在汽车、行人、自行车类数据集上的平均检测精度有了较大的提升,尤其在小目标稀疏的点中效果显著,这进一步证实了该算法的有效性。
-
公开(公告)号:CN116662587A
公开(公告)日:2023-08-29
申请号:CN202310942873.3
申请日:2023-07-31
Applicant: 华侨大学
IPC: G06F16/53 , G06F16/55 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于查询生成器的人物交互检测方法、装置及设备,方法包括以下步骤:读取待检测的目标图像;利用特征提取器对所述目标图像进行特征提取获得图像特征;随机初始化一组人‑物对的先验边界框,将所述图像特征与所述先验边界框共同输入查询生成器,并基于所述查询生成器生成每层实例检测器和交互分类器所需的两组查询向量以及查询向量的位置信息;经由不同的解码器将输入的图像特征、查询向量和位置信息解码为特征向量组;根据所述特征向量组得到人物交互的预测结果。本发明将查询向量视为候选的人物交互检测结果,通过初始化人‑物对的先验边界框,来从中生成所需的查询向量,能够更精准且高效地进行人物交互行为识别。
-
-
-
-
-
-
-
-
-