-
公开(公告)号:CN114582086A
公开(公告)日:2022-06-03
申请号:CN202111511216.0
申请日:2021-12-04
Applicant: 电子科技大学长三角研究院(湖州)
Abstract: 本发明涉及智能监控安全防护技术领域,尤其涉及一种基于目标检测的行为报警系统,包括用于行为采集、数据上传的目标检测单元,与装载基于残差网络ResNet101的改进Faster RCNN模型用于检测人体行为的神经网络单元,与所述云端服务器通过无线通信连接的用于查看智能摄像头模块和接收报警通知的用户单元;本发明所提供的技术方案有效克服现有智能监控所存在的不能摆脱人力实现智能监控、不能针对多场景及时地对用户进行危险行为智能通知的缺陷。
-
公开(公告)号:CN118862962A
公开(公告)日:2024-10-29
申请号:CN202410911685.9
申请日:2024-07-09
Applicant: 电子科技大学
IPC: G06N3/0455 , G06N3/0464 , G06N3/084 , G06V10/52 , G06V20/70 , G06V40/10 , G06V10/80 , G06V40/20 , G06V10/764
Abstract: 本发明致力于解决复杂背景下的人与物体交互检测难题。本发明对基于多尺度上下文聚合的多重关系复用网络进行了改进,具体技术方案包括:空间感知合并模块、人体姿态融合模块以及细粒度锚点解码。针对空间感知合并模块,它充分利用了编码后多尺度特征中包含的空间结构和层级信息,通过与内容嵌入的深度融合与对齐,确保模型能够精确捕捉不同空间层级间的关联及交互细节。针对人体姿态融合模块,本发明引入人体姿态信息作为交互意图的补充表示,使模型自适应学习并关注关键的人体关节特征而无需额外标注。针对细粒度锚点解码,细粒度锚点作为位置先验,引导解码器关注特定的兴趣区域,并直接将语义信息融入内容嵌入中,后者用于预测HOI实例。
-
公开(公告)号:CN118821852A
公开(公告)日:2024-10-22
申请号:CN202410911680.6
申请日:2024-07-09
Applicant: 电子科技大学
IPC: G06N3/0455 , G06N3/0464 , G06N5/04 , G06V10/52 , G06V10/42 , G06V10/44 , G06V10/82 , G06V40/20 , G06V10/25 , G06V10/764 , G06V20/70
Abstract: 本发明涉及计算机视觉与深度学习技术的前沿领域,提出了一种基于多尺度上下文聚合与多重关系复用的创新网络架构。该网络通过精心设计,能够高效地整合图像中不同尺度的上下文信息,从全局背景到局部细节进行全面捕捉,进而提升对复杂场景的理解能力。同时,网络内部实现了多重关系的复用,增强了跨层级特征之间的交互与融合,有效提升了图像识别、分割及增强等任务的精度与效率。特别地,在人体‑物体交互(HOI)检测等高级视觉任务中,本发明的网络展现出卓越的性能,为相关领域的研究与应用提供了强有力的技术支撑。
-
公开(公告)号:CN117372706A
公开(公告)日:2024-01-09
申请号:CN202310846089.2
申请日:2023-07-11
Applicant: 电子科技大学
IPC: G06V10/40 , G06V10/82 , G06V10/77 , G06V10/46 , G06V10/764 , G06V40/20 , G06N3/0455 , G06N3/08
Abstract: 本发明涉及图像理解领域中的中的人物交互关系检测领域,是一种多尺度可变形的人物交互关系检测方法。目前基于Transformer的算法由于缺少多尺度特征,难以准确地从高分辨率特征图中识别小目标,进而影响人物交互关系的预测,多尺度特征的加入虽然可以为人物交互关系检测算法提供新的特征,但是特征的增加也会导致复杂度的急剧增加。为解决上述问题,本发明提出了一种基于QPIC算法改进的人物交互关系检测算法,具体过程为:一:本发明使用Swin Transformer网络增强特征提取能力。二:引入多尺度特征提升了识别准确率。三:将特征向量通过多尺度可变形的注意力模块进行初步编码,采样特征最为显著的特征点,使算法轻量化从而降低计算复杂度。
-
公开(公告)号:CN116452688A
公开(公告)日:2023-07-18
申请号:CN202310334196.7
申请日:2023-03-31
Applicant: 电子科技大学
IPC: G06T11/00 , G06N3/0475 , G06N3/0455 , G06N3/094 , G06N3/0464 , G06N3/0442 , G06N3/092
Abstract: 本发明公开了一种基于共同注意力机制的图像描述生成方法。该发明在图像描述算法的语义对齐上具有一定的有效性。针对生成描述与图像中区域不对齐问题,在编码器‑解码器框架中加入了先知注意力机制,先知注意力机制能够根据未来时间步骤的信息,动态地关注图像区域;针对图像描述中语义一致性的问题,通过在判别器中引入共同注意力机制,引入对抗学习的思想,训练生成器与判别器,以对生成的图像描述进行分类,从而提高其语义一致性。基于共同注意力机制的图像描述算法模型能够精准的生成符合图像内容的描述,且基于生成对抗网络生成语言多样化的图像描述。
-
公开(公告)号:CN114719861A
公开(公告)日:2022-07-08
申请号:CN202111474535.9
申请日:2021-12-04
Applicant: 电子科技大学长三角研究院(湖州)
Abstract: 本发明公开了一种基于UWB和ELM的无人机室内定位技术。该发明在室内精确定位具有一定的通用性,该专利以室内无人机定位作为说明案例。针对精确定位问题,在定位过程中加入了K‑Means聚类用于筛选可靠数据,聚类算法对于数据筛选具有一定的通用性和可移植性;针对环境的固定干扰以及UWB收发设备的误差问题,需要通过极限学习机进行训练,能有效提升定位精度和定位效率。
-
公开(公告)号:CN114708474A
公开(公告)日:2022-07-05
申请号:CN202210244292.8
申请日:2022-03-14
Applicant: 电子科技大学
Abstract: 本发明属于图像描述领域,具体为一种融合局部和全局特征的图像语义理解方法。图像中包含丰富的语义信息,包括图像中的目标、目标的属性以及不同目标之间的相互关系等,传统的目标检测、图像分割等技术并不能达到挖掘所有这些信息的目的,给图片生成文字描述的图像语义理解算法可以深入挖掘图片中的各种语义信息,对于理解图片的内容,缩减图片和文字之间的“语义鸿沟”具有重大意义。当前的图像语义理解算法依赖于计算机视觉和自然语言处理技术的发展,主要使用在机器翻译领域流行的编解码框架,其中编码器提取图像特征,解码器将提取的图像特征翻译成文字描述。然而当前的编码器大多采用基于目标检测的方法,这样往往会丢失图像背景和一些细节信息,使得描述效果不够理想。因此本发明对基于编解码框架的的图像语义理解算法进行了相应改进,提高编码器提取图像特征的能力,从而使得生成的描述语句更加准确。
-
公开(公告)号:CN114385796A
公开(公告)日:2022-04-22
申请号:CN202111471317.X
申请日:2021-12-04
Applicant: 电子科技大学长三角研究院(湖州)
IPC: G06F16/332 , G06K9/62
Abstract: 本发明公开了一种基于fasttext的垃圾信息识别方法,本发明涉及自然语言处理和机器学习领域,结合TF‑IDF算法和fasttext算法,形成新的TF‑fasttext算法提供了对垃圾信息识别的效率。本发明对传统的fasttext算法进行了三个方面的优化。首先将TF‑IDF算法进行改进,将同类文本和不同文本之间的关系考虑进去,引入参数类频,来代表特征词在某类中出现的次数。其次将改进后的TF‑IDF算法与n‑gram模型结合,形成新的TF‑IDF‑N算法对n‑gram操作后的词进行特征筛选,根据特征词权重保留高区分度的词,去掉低区分度的词。从而消减了fasttext模型的噪声数据,保留更具代表性的特征词序列。最后在fasttext算法的输出层用层次softmax函数提升了模型判断的精度,而且缩短了样本训练的时间。
-
-
-
-
-
-
-
-