-
公开(公告)号:CN118692007A
公开(公告)日:2024-09-24
申请号:CN202410776255.0
申请日:2024-06-17
Applicant: 华中科技大学
Abstract: 本申请公开了一种具有分析能力的视频异常检测及其模型训练方法,属于视频检测技术领域。本申请视频异常检测模型由视频异常检测网络和多模态解码网络构成,其中,视频异常检测网络通过由弱监督训练数据转化的全监督训练数据进行异常视频的识别训练,再通过多模态解码网络学习异常图像帧特征、对应指令文本特征和对应分析文本特征之间的特征关系,由此本申请视频异常检测模型不仅能高效检测出视频中的异常事件,同时也实现了对检测出的异常事件进行解释分析。
-
公开(公告)号:CN114581819B
公开(公告)日:2024-09-20
申请号:CN202210163283.6
申请日:2022-02-22
Applicant: 华中科技大学
IPC: G06V20/40 , G06V40/20 , G06V10/75 , G06V10/82 , G06N3/0442
Abstract: 本发明提供一种视频行为识别方法及系统,包括:确定预训练好的识别网络;识别网络包括:时空特征提取模块和集合匹配模块;时空特征提取模块用于提取接收到视频的空间特征和时间特征,集和匹配模块用于基于空间特征和时间特征以及模板视频的时空特征将接收到视频与模板视频进行匹配,识别接收到视频的行为;模板视频包括T类视频;对识别网络进行训练时,从T类视频中循环随机选取S类视频,为每类视频确定K个训练样本,将S类视频对应的训练样本输入到识别网络进行训练;将待识别的视频和模板视频输入到预训练好的识别网络中,以对待识别视频进行行为识别,输出对应的行为识别结果。本发明在小样本场景下,可以实现灵活准确的视频匹配和识别。
-
公开(公告)号:CN110717916A
公开(公告)日:2020-01-21
申请号:CN201910930769.6
申请日:2019-09-29
Applicant: 华中科技大学
Abstract: 本发明公开了一种基于卷积神经网络的肺栓塞检测系统,包括:候选区域提取网络是一个使用了带有跳跃连接的自动编码解码的全卷积网络,对待检测计算机断层扫描肺血管造影图像进行候选区域提取,得到多个不同大小的假阳性候选区域;3D仿射变换网络,用于从多个不同大小的假阳性候选区域中产生血管对齐的、大小固定的立方体并取出它们三个正交层;假阳预测筛查网络,将所述三个正交层输入到一个包含2个全连接层的2D分类网络进行假阳预测筛查。本发明方法可以解决误差累积的问题;能自动抽取更具有辨别力的3D图像特征,减少了容积效应的影响,并且不依赖与研究者的经验;在保证召回率的同时提高了准确率。
-
公开(公告)号:CN114022698B
公开(公告)日:2025-04-29
申请号:CN202111202508.6
申请日:2021-10-15
Applicant: 华中科技大学
IPC: G06V10/764 , G06V10/774 , G06V20/40
Abstract: 本发明公开了一种基于二叉树结构的多标签行为识别方法及装置,包括:S1,提取训练好的第一多标签行为识别网络中的第一分类器输出的各行为类别的参数向量;S2,基于所述参数向量计算各行为类别之间的相似度并按照相似度从高到低进行排序,将各行为类别依次进行不重复的两两递归组合,以构建二叉树;S3,基于所述特征提取网络、第二分类器及二叉树,构建第二多标签行为识别网络;S4,采用训练后的第二多标签行为识别网络对待测视频进行行为识别。通过采用基于二叉树的多标签行为分类技术,可以实现对不同类别的行为间相似性的解耦,尤其是对于视觉上高度相似又难以区分的行为,从而有效提高识别准确率。
-
公开(公告)号:CN114022698A
公开(公告)日:2022-02-08
申请号:CN202111202508.6
申请日:2021-10-15
Applicant: 华中科技大学
IPC: G06V10/764 , G06V10/774 , G06V20/40 , G06K9/62
Abstract: 本发明公开了一种基于二叉树结构的多标签行为识别方法及装置,包括:S1,提取训练好的第一多标签行为识别网络中的第一分类器输出的各行为类别的参数向量;S2,基于所述参数向量计算各行为类别之间的相似度并按照相似度从高到低进行排序,将各行为类别依次进行不重复的两两递归组合,以构建二叉树;S3,基于所述特征提取网络、第二分类器及二叉树,构建第二多标签行为识别网络;S4,采用训练后的第二多标签行为识别网络对待测视频进行行为识别。通过采用基于二叉树的多标签行为分类技术,可以实现对不同类别的行为间相似性的解耦,尤其是对于视觉上高度相似又难以区分的行为,从而有效提高识别准确率。
-
公开(公告)号:CN119672188A
公开(公告)日:2025-03-21
申请号:CN202411940358.2
申请日:2024-12-26
Applicant: 华中科技大学
IPC: G06T13/40 , G06V40/16 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0455 , G06N3/0475 , G06N3/09 , G06N3/096
Abstract: 本申请属于计算机视觉与视频生成领域,具体公开了一种基于一致性蒸馏的人像动画生成方法及系统。方法包括:收集参考图像样本和人体姿态序列样本作为训练集,基于所述训练集构建预训练的教师模型,所述教师模型用于生成目标视频;初始化一致性蒸馏模型得到学生模型,通过轨迹分段一致性蒸馏法将所述教师模型的知识传递给学生模型;通过辅助损失优化、动态区域加权优化以及面部细节注入对所述学生模型进行优化,得到优化模型;将待推理的参考图像和人体姿态序列输入至所述优化模型中,得到人像动画视频。通过本申请能够有效提升生成视频的时序一致性、连贯性和细节保真度。
-
公开(公告)号:CN110717916B
公开(公告)日:2022-08-30
申请号:CN201910930769.6
申请日:2019-09-29
Applicant: 华中科技大学
IPC: G06T7/11 , G06V10/764 , G06N3/04 , G06N3/08 , G06T3/00
Abstract: 本发明公开了一种基于卷积神经网络的肺栓塞检测系统,包括:候选区域提取网络是一个使用了带有跳跃连接的自动编码解码的全卷积网络,对待检测计算机断层扫描肺血管造影图像进行候选区域提取,得到多个不同大小的假阳性候选区域;3D仿射变换网络,用于从多个不同大小的假阳性候选区域中产生血管对齐的、大小固定的立方体并取出它们三个正交层;假阳预测筛查网络,将所述三个正交层输入到一个包含2个全连接层的2D分类网络进行假阳预测筛查。本发明方法可以解决误差累积的问题;能自动抽取更具有辨别力的3D图像特征,减少了容积效应的影响,并且不依赖与研究者的经验;在保证召回率的同时提高了准确率。
-
公开(公告)号:CN114581819A
公开(公告)日:2022-06-03
申请号:CN202210163283.6
申请日:2022-02-22
Applicant: 华中科技大学
Abstract: 本发明提供一种视频行为识别方法及系统,包括:确定预训练好的识别网络;识别网络包括:时空特征提取模块和集合匹配模块;时空特征提取模块用于提取接收到视频的空间特征和时间特征,集和匹配模块用于基于空间特征和时间特征以及模板视频的时空特征将接收到视频与模板视频进行匹配,识别接收到视频的行为;模板视频包括T类视频;对识别网络进行训练时,从T类视频中循环随机选取S类视频,为每类视频确定K个训练样本,将S类视频对应的训练样本输入到识别网络进行训练;将待识别的视频和模板视频输入到预训练好的识别网络中,以对待识别视频进行行为识别,输出对应的行为识别结果。本发明在小样本场景下,可以实现灵活准确的视频匹配和识别。
-
-
-
-
-
-
-