-
公开(公告)号:CN118506452A
公开(公告)日:2024-08-16
申请号:CN202410667052.8
申请日:2024-05-28
Applicant: 江南大学
IPC: G06V40/20 , G06V10/44 , G06V10/62 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/042 , G06N3/045 , G06N3/0464 , G06N3/084
Abstract: 本申请提供一种基于时空重聚合图卷积网络的骨架行为识别方法,其能够有效提取关节局部动作特征,同时实现了对跨帧时间特征的增强,提升了时间特征的提取能力,不但有较高的识别准确率,同时具备有良好的泛化性能。其通过对人体骨架结构进行拆分,分别计算其通道注意力进行局部特征增强并聚合还原,提出空间重聚合注意力模块,并结合通道拓扑优化图卷积模块,进而构造空间重聚合图卷积模块,实现对局部动作特征的提取;然后对特征图进行跨帧分割,并结合高效多尺度注意力机制增强各子特征图的跨帧时间特征后重新聚合,提出时序重聚合卷积模块;最后,将时序重聚合卷积模块与空间重聚合图卷积模块相结合,进一步提出时空重聚合图卷积网络模型。
-
公开(公告)号:CN113744758B
公开(公告)日:2023-12-01
申请号:CN202111089655.7
申请日:2021-09-16
Applicant: 江南大学
IPC: G10L25/24 , G10L25/30 , G10L25/48 , G10L25/51 , G06N3/0464 , G06N3/0442 , G06N3/045 , G06N3/048 , G06N3/08
Abstract: 本发明提供的基于2‑DenseGRUNet模型的声音事件检测方法,以2阶DenseNet网络模型为基础,加入了门控循环单元GRU网络,构建了声音事件检测模型;相对于传统卷积神经网络以及循环神经网络模型,本专利技术方案中的声音事件检测模型结合了2‑DenseNet和GRU的优点,既能更高效利用特征信息将其融合,获取更多有效的特征信息,同时可有效进行时间序列建模。基于本专利技术方案中的声音事件检测模型在检测城市声音事件中,具有更低的平均片段错误率,和更高的F‑Score分数,确保基于本发明方法进行的声音分类结果更加准确。
-
公开(公告)号:CN115206327A
公开(公告)日:2022-10-18
申请号:CN202210778411.8
申请日:2022-07-04
Applicant: 江南大学
Abstract: 本发明提供一种基于DR‑Res2net模块的声纹识别方法,其在处理声纹数据时能提供丰富、有效的特征信息,模型有较强的泛化能力,分类具有更低的等错误率,进而能够得到更理想的识别效果。本发明的技术方案中,将稠密DenseNet模型的特点融入到Res2Net模型中,构建DR‑Res2net模型,在声音识别模型中,以DR‑Res2Block为核心模块进行声纹数据的识别;识别过程中,每个DR‑Res2net模块中对每一个输出的特征同时进行残差和稠密连接,获取更加丰富的特征,模块中的addition处理使得每一个特征的所包含的信息量增加,同时concatennaiton处理使得特征包含高语义低分辨率和低语义高分辨率的特征,最大程度上保留了不同感受野下的特征。
-
公开(公告)号:CN115056224B
公开(公告)日:2025-05-16
申请号:CN202210708048.2
申请日:2022-06-22
Applicant: 江南大学
Abstract: 本发明提供的一种基于动态实时视觉SLAM方法的移动机器人,其通过设置图像分割模块和视觉SLAM模块,将图像采集模块获取的环境图像数据分别输入到图像分割模块和视觉SLAM模块中,将图像分割处理和位姿估计操作并行处理,通过在Lucas‑Kanade稀疏光流模块、二次剔除模块中分别进行异常点的剔除,图像分割模块输出的动态图像帧在二次剔除模块中参与第二次异常点剔除的操作,不但提高识别准确率,而在确保位姿估计精度的基础上,极大地提高了处理效率,确保本发明技术方案能够在动态环境下进行实时位姿估计,使移动机器人能够更灵活的适用于不同的应用场景。
-
公开(公告)号:CN115661861A
公开(公告)日:2023-01-31
申请号:CN202211290028.4
申请日:2022-10-21
Applicant: 江南大学
Abstract: 本申请提供一种基于动态时序多维自适应图卷积网络的骨架行为识别方法,通过非局部网络和维度变换模块,构建多维自适应图卷积模块,同时将动态卷积和时序卷积相结合,在时序卷积中引入SE注意力网络计算各卷积核权重和偏置的权值,构造动态时序卷积模块,将二者相结合并在多流网络下进行端到端的训练,构造动态时序多维自适应图卷积网络模型;本申中的动态时序多维自适应图卷积网络模型能够自骨架时空图中充分提取空间域内的多维信息,同时增强了时间特征的表示能力,基于本申请的骨架行为识别方法,不但能够取得优异的识别准确率,而且具备良好的泛化性能。
-
公开(公告)号:CN116580449A
公开(公告)日:2023-08-11
申请号:CN202310404197.4
申请日:2023-04-17
Applicant: 江南大学
Abstract: 本申请提供一种基于超连接图卷积网络的骨架行为识别方法,根据人体骨架的连接关系构造超连接邻接矩阵,进一步构建超连接自适应图卷积模块,同时在全维动态卷积中引入两个残差连接,构建残差全维动态时序卷积模块,将二者相结合并基于融合特征数据进行端到端的训练,获得超连接图卷积网络模型;本申请中的超连接图卷积网络模型能够从骨架特征数据中充分提取节点的长距离依赖关系,同时减小特征损失,增强了时间特征的表示能力,基于本申请的骨架行为识别方法,不但能够取得优异的识别准确率,而且具备良好的泛化性能。
-
公开(公告)号:CN115056224A
公开(公告)日:2022-09-16
申请号:CN202210708048.2
申请日:2022-06-22
Applicant: 江南大学
Abstract: 本发明提供的一种基于动态实时视觉SLAM方法的移动机器人,其通过设置图像分割模块和视觉SLAM模块,将图像采集模块获取的环境图像数据分别输入到图像分割模块和视觉SLAM模块中,将图像分割处理和位姿估计操作并行处理,通过在Lucas‑Kanade稀疏光流模块、二次剔除模块中分别进行异常点的剔除,图像分割模块输出的动态图像帧在二次剔除模块中参与第二次异常点剔除的操作,不但提高识别准确率,而在确保位姿估计精度的基础上,极大地提高了处理效率,确保本发明技术方案能够在动态环境下进行实时位姿估计,使移动机器人能够更灵活的适用于不同的应用场景。
-
公开(公告)号:CN113744758A
公开(公告)日:2021-12-03
申请号:CN202111089655.7
申请日:2021-09-16
Applicant: 江南大学
Abstract: 本发明提供的基于2‑DenseGRUNet模型的声音事件检测方法,以2阶DenseNet网络模型为基础,加入了门控循环单元GRU网络,构建了声音事件检测模型;相对于传统卷积神经网络以及循环神经网络模型,本专利技术方案中的声音事件检测模型结合了2‑DenseNet和GRU的优点,既能更高效利用特征信息将其融合,获取更多有效的特征信息,同时可有效进行时间序列建模。基于本专利技术方案中的声音事件检测模型在检测城市声音事件中,具有更低的平均片段错误率,和更高的F‑Score分数,确保基于本发明方法进行的声音分类结果更加准确。
-
-
-
-
-
-
-