-
公开(公告)号:CN114565757A
公开(公告)日:2022-05-31
申请号:CN202210145456.1
申请日:2022-02-17
Applicant: 西安电子科技大学
Abstract: 本发明公开了一种应用于复杂场景下的语义分割网络模型,采用空洞变换特征金字塔模块与阶段性特征注意力模块组成软加权多阶段特征网络,其中,空洞变换特征金字塔模块,利用空洞空间金字塔池化和自适应变换函数分别作为模块中深层与浅层阶段性特征的变换函数,扩大网络整体的感受野更好的提取大尺度目标的特征和全局信息;阶段性特征注意力模块,用于在不同阶段的特征上提取对多尺度目标的不同关注程度,从而有效地保存了不同阶段具有辨识度的特征。空洞变换特征金字塔模块相比于特征金字塔模块能从多阶段更好的提取尺度差异过大的目标特征。阶段性特征注意力模块能在不同阶段的特征上提取对多尺度目标的不同关注程度。
-
公开(公告)号:CN114255195A
公开(公告)日:2022-03-29
申请号:CN202010997120.9
申请日:2020-09-21
Applicant: 西安电子科技大学
IPC: G06T5/50
Abstract: 本发明实施例提供了U‑net网络的多参数MRI图像的融合方法及装置,其中,方法通过将前列腺癌的MRI图像对输入U‑net网络中,U‑net网络输出基于像素信息生成的加权图像,加权图像中的像素值表示加权图像在T2W图像或ADC图像的权重值,然后通过加权图像对T2W图像以及ADC图像进行融合,避免了融合过程中伪影的产生或能量的损失,融合图像提供给医生,可以提高医生的工作效率,降低误检率,同时提高融合图像在前列腺区域的清晰度和对比度,提高融合图像在整体图像视觉感知。
-
公开(公告)号:CN114972444B
公开(公告)日:2024-10-18
申请号:CN202210535337.7
申请日:2022-05-17
Applicant: 西安电子科技大学
Abstract: 本发明涉及一种基于多头对比网络的目标跟踪方法,包括构建多头对比网络;获取模板图像;获取对比图像;获取搜索图像;提取图像的深度特征;计算空间依赖关系;计算通道依赖关系;计算语义依赖关系;目标分类和边界框回归;多损失联合训练;分类头和回归头。本发明通过构建多头对比网络,它对骨干网络中的每个卷积层构建一个单独的嵌入空间,学习同一目标不同外观的特征表示的不变性;提出了全局上下文一致性损失,不仅仅保持语义信息上的一致性,也在特征表示的空间关系和通道关系上保持一致性,进一步增强了特征表示的能力,显著的提升了跟踪方法的性能。
-
公开(公告)号:CN115951783A
公开(公告)日:2023-04-11
申请号:CN202310055231.1
申请日:2023-02-04
Applicant: 西安电子科技大学
IPC: G06F3/01 , G06V40/20 , G06V20/40 , G06V10/764
Abstract: 本发明一种基于手势识别的计算机人机交互方法,使用选择配置惯用手势信息;按照系统提示和自身习惯分别作出不同动作的手势,并拍摄记录每帧图像中每个手势的信息,开启计算机摄像头,获取视频流;对视频流中的每一帧图像进行亮度和对比度增强;获取增强后的图像中的手部关键点坐标;根据手部关键点坐标,对实时视频进行多尺度距离统一映射,消除因手部与摄像头的距离造成的图像中手部关键点之间的距离误差;根据多尺度距离统一映射后的手部关键点坐标对手势进行分类,每个可识别的分类手势对应人机交互的一种设定操作;根据分类结果进行相应操作。本发明具有轻量级、低门槛、多功能、高实时性的特点。
-
公开(公告)号:CN114255195B
公开(公告)日:2024-11-05
申请号:CN202010997120.9
申请日:2020-09-21
Applicant: 西安电子科技大学
IPC: G06T5/50
Abstract: 本发明实施例提供了U‑net网络的多参数MRI图像的融合方法及装置,其中,方法通过将前列腺癌的MRI图像对输入U‑net网络中,U‑net网络输出基于像素信息生成的加权图像,加权图像中的像素值表示加权图像在T2W图像或ADC图像的权重值,然后通过加权图像对T2W图像以及ADC图像进行融合,避免了融合过程中伪影的产生或能量的损失,融合图像提供给医生,可以提高医生的工作效率,降低误检率,同时提高融合图像在前列腺区域的清晰度和对比度,提高融合图像在整体图像视觉感知。
-
公开(公告)号:CN114550753A
公开(公告)日:2022-05-27
申请号:CN202210135633.8
申请日:2022-02-14
Applicant: 西安电子科技大学重庆集成电路创新研究院
Abstract: 本发明涉及一种基于深度学习的流式语音激活检测方法,先输入RAW声音波形信号片段,进行声学特征提取,结合SpecAugment数据增强算法计算得到提取后的声学特征张量;然后构建基于深度卷积神经网络模型,输出结果为0或1,其中1代表语音信号,0代表非语音信号,并训练得到可用的作为语音激活检测模型权重参数;最后语音激活检测模型在执行预测时,将得到的声学特征张量作为输入,得到预测输出结果。对于算法模型的实时性、准确率、鲁棒性、和弹性伸缩性等,都具有良好的表现,能够为语音通信、语音识别、智能问答、视频会议实时字幕和实时翻译等应用场景提供关键技术支持,同时也可用于非实时性的场景,具有一举两得的效果。
-
公开(公告)号:CN116434331A
公开(公告)日:2023-07-14
申请号:CN202310277107.X
申请日:2023-03-21
Applicant: 西安电子科技大学
IPC: G06V40/20 , G06N3/045 , G06N3/0475 , G06N3/094 , G06N3/0442 , G06V20/40 , G06V10/82 , G06V10/764 , G06V10/80
Abstract: 基于记忆网络和生成对抗网络的抗干扰手势识别方法、系统、设备及介质,其方法为:首先建立记忆网络,将不同样本的手势特征根据相似性写入不同的记忆槽中,通过记忆读取获取手势不变量,缩小不同样本和手势不变量之间的差距即可避免明显的与手势无关因素的干扰;其次基于生成对抗网络来构建跨模态循环,将每个模态的特征分解为模态不变量和模态特定特征,利用模态不变量以及模态特定特征实现跨模态重构,从而促进不同模态之间的信息互补;最后将得到的手势不变量特征和模态特征共同输入手势识别网络中,进行抗干扰手势识别;其系统、设备及介质能够基于记忆网络和生成对抗网络进行抗干扰手势识别,能够提高识别准确率及识别效率。
-
公开(公告)号:CN114972444A
公开(公告)日:2022-08-30
申请号:CN202210535337.7
申请日:2022-05-17
Applicant: 西安电子科技大学
Abstract: 本发明涉及一种基于多头对比网络的目标跟踪方法,包括构建多头对比网络;获取模板图像;获取对比图像;获取搜索图像;提取图像的深度特征;计算空间依赖关系;计算通道依赖关系;计算语义依赖关系;目标分类和边界框回归;多损失联合训练;分类头和回归头。本发明通过构建多头对比网络,它对骨干网络中的每个卷积层构建一个单独的嵌入空间,学习同一目标不同外观的特征表示的不变性;提出了全局上下文一致性损失,不仅仅保持语义信息上的一致性,也在特征表示的空间关系和通道关系上保持一致性,进一步增强了特征表示的能力,显著的提升了跟踪方法的性能。
-
公开(公告)号:CN114550708A
公开(公告)日:2022-05-27
申请号:CN202210151123.X
申请日:2022-02-14
Applicant: 西安电子科技大学重庆集成电路创新研究院
Abstract: 本发明涉及一种基于深度学习的流式实时语音识别方法,通过输入RAW声音波形信号的语音片段,构建语音识别声学模型并训练,在执行预测时,将得到的声学特征张量作为输入,并通过流式CTC解码器的解码算法进行解码;语音识别的语言模型采用统计N‑Gram模型,通过大规模语料库得到N元组统计数据;结合中文汉语拼音与汉字对应关系的字典,使用流式维特比解码算法进行解码,得到语音识别最终文本结果;在模型落地部署后调用API接口或模块,使用流式算法模式,结合流式实时语音激活检测方法,实现流式实时语音识别。该方法不存在上文信息对下文信息的长时依赖,上下文无关,或仅存在下文信息对上文信息的依赖,可实现算法模型推理时的流式实时语音识别。
-
-
-
-
-
-
-
-