一种应用于语义分割的软加权多阶段网络模型

    公开(公告)号:CN114565757A

    公开(公告)日:2022-05-31

    申请号:CN202210145456.1

    申请日:2022-02-17

    Abstract: 本发明公开了一种应用于复杂场景下的语义分割网络模型,采用空洞变换特征金字塔模块与阶段性特征注意力模块组成软加权多阶段特征网络,其中,空洞变换特征金字塔模块,利用空洞空间金字塔池化和自适应变换函数分别作为模块中深层与浅层阶段性特征的变换函数,扩大网络整体的感受野更好的提取大尺度目标的特征和全局信息;阶段性特征注意力模块,用于在不同阶段的特征上提取对多尺度目标的不同关注程度,从而有效地保存了不同阶段具有辨识度的特征。空洞变换特征金字塔模块相比于特征金字塔模块能从多阶段更好的提取尺度差异过大的目标特征。阶段性特征注意力模块能在不同阶段的特征上提取对多尺度目标的不同关注程度。

    U-net网络的多参数MRI图像的融合方法及装置

    公开(公告)号:CN114255195A

    公开(公告)日:2022-03-29

    申请号:CN202010997120.9

    申请日:2020-09-21

    Abstract: 本发明实施例提供了U‑net网络的多参数MRI图像的融合方法及装置,其中,方法通过将前列腺癌的MRI图像对输入U‑net网络中,U‑net网络输出基于像素信息生成的加权图像,加权图像中的像素值表示加权图像在T2W图像或ADC图像的权重值,然后通过加权图像对T2W图像以及ADC图像进行融合,避免了融合过程中伪影的产生或能量的损失,融合图像提供给医生,可以提高医生的工作效率,降低误检率,同时提高融合图像在前列腺区域的清晰度和对比度,提高融合图像在整体图像视觉感知。

    基于多头对比网络的目标跟踪方法

    公开(公告)号:CN114972444B

    公开(公告)日:2024-10-18

    申请号:CN202210535337.7

    申请日:2022-05-17

    Abstract: 本发明涉及一种基于多头对比网络的目标跟踪方法,包括构建多头对比网络;获取模板图像;获取对比图像;获取搜索图像;提取图像的深度特征;计算空间依赖关系;计算通道依赖关系;计算语义依赖关系;目标分类和边界框回归;多损失联合训练;分类头和回归头。本发明通过构建多头对比网络,它对骨干网络中的每个卷积层构建一个单独的嵌入空间,学习同一目标不同外观的特征表示的不变性;提出了全局上下文一致性损失,不仅仅保持语义信息上的一致性,也在特征表示的空间关系和通道关系上保持一致性,进一步增强了特征表示的能力,显著的提升了跟踪方法的性能。

    一种基于手势识别的计算机人机交互方法

    公开(公告)号:CN115951783A

    公开(公告)日:2023-04-11

    申请号:CN202310055231.1

    申请日:2023-02-04

    Abstract: 本发明一种基于手势识别的计算机人机交互方法,使用选择配置惯用手势信息;按照系统提示和自身习惯分别作出不同动作的手势,并拍摄记录每帧图像中每个手势的信息,开启计算机摄像头,获取视频流;对视频流中的每一帧图像进行亮度和对比度增强;获取增强后的图像中的手部关键点坐标;根据手部关键点坐标,对实时视频进行多尺度距离统一映射,消除因手部与摄像头的距离造成的图像中手部关键点之间的距离误差;根据多尺度距离统一映射后的手部关键点坐标对手势进行分类,每个可识别的分类手势对应人机交互的一种设定操作;根据分类结果进行相应操作。本发明具有轻量级、低门槛、多功能、高实时性的特点。

    U-net网络的多参数MRI图像的融合方法及装置

    公开(公告)号:CN114255195B

    公开(公告)日:2024-11-05

    申请号:CN202010997120.9

    申请日:2020-09-21

    Abstract: 本发明实施例提供了U‑net网络的多参数MRI图像的融合方法及装置,其中,方法通过将前列腺癌的MRI图像对输入U‑net网络中,U‑net网络输出基于像素信息生成的加权图像,加权图像中的像素值表示加权图像在T2W图像或ADC图像的权重值,然后通过加权图像对T2W图像以及ADC图像进行融合,避免了融合过程中伪影的产生或能量的损失,融合图像提供给医生,可以提高医生的工作效率,降低误检率,同时提高融合图像在前列腺区域的清晰度和对比度,提高融合图像在整体图像视觉感知。

    基于深度学习的流式实时语音激活检测方法

    公开(公告)号:CN114550753A

    公开(公告)日:2022-05-27

    申请号:CN202210135633.8

    申请日:2022-02-14

    Abstract: 本发明涉及一种基于深度学习的流式语音激活检测方法,先输入RAW声音波形信号片段,进行声学特征提取,结合SpecAugment数据增强算法计算得到提取后的声学特征张量;然后构建基于深度卷积神经网络模型,输出结果为0或1,其中1代表语音信号,0代表非语音信号,并训练得到可用的作为语音激活检测模型权重参数;最后语音激活检测模型在执行预测时,将得到的声学特征张量作为输入,得到预测输出结果。对于算法模型的实时性、准确率、鲁棒性、和弹性伸缩性等,都具有良好的表现,能够为语音通信、语音识别、智能问答、视频会议实时字幕和实时翻译等应用场景提供关键技术支持,同时也可用于非实时性的场景,具有一举两得的效果。

    基于多头对比网络的目标跟踪方法

    公开(公告)号:CN114972444A

    公开(公告)日:2022-08-30

    申请号:CN202210535337.7

    申请日:2022-05-17

    Abstract: 本发明涉及一种基于多头对比网络的目标跟踪方法,包括构建多头对比网络;获取模板图像;获取对比图像;获取搜索图像;提取图像的深度特征;计算空间依赖关系;计算通道依赖关系;计算语义依赖关系;目标分类和边界框回归;多损失联合训练;分类头和回归头。本发明通过构建多头对比网络,它对骨干网络中的每个卷积层构建一个单独的嵌入空间,学习同一目标不同外观的特征表示的不变性;提出了全局上下文一致性损失,不仅仅保持语义信息上的一致性,也在特征表示的空间关系和通道关系上保持一致性,进一步增强了特征表示的能力,显著的提升了跟踪方法的性能。

    基于深度学习的流式实时语音识别方法

    公开(公告)号:CN114550708A

    公开(公告)日:2022-05-27

    申请号:CN202210151123.X

    申请日:2022-02-14

    Abstract: 本发明涉及一种基于深度学习的流式实时语音识别方法,通过输入RAW声音波形信号的语音片段,构建语音识别声学模型并训练,在执行预测时,将得到的声学特征张量作为输入,并通过流式CTC解码器的解码算法进行解码;语音识别的语言模型采用统计N‑Gram模型,通过大规模语料库得到N元组统计数据;结合中文汉语拼音与汉字对应关系的字典,使用流式维特比解码算法进行解码,得到语音识别最终文本结果;在模型落地部署后调用API接口或模块,使用流式算法模式,结合流式实时语音激活检测方法,实现流式实时语音识别。该方法不存在上文信息对下文信息的长时依赖,上下文无关,或仅存在下文信息对上文信息的依赖,可实现算法模型推理时的流式实时语音识别。

Patent Agency Ranking