一种基于对抗网络与注意力机制的视线估计方法

    公开(公告)号:CN118629082A

    公开(公告)日:2024-09-10

    申请号:CN202410723019.2

    申请日:2024-06-05

    Abstract: 本发明请求保护一种基于对抗网络与注意力机制的视线估计方法,该方法通过一种特征融合对抗网络FadNet对视线方向进行估计,FadNet包括提取网络和融合网络两个部分。在提取网络中引入对抗模块,以对抗优化的方法更精准地提取视线估计相关特征;融合网络则能够将多个通道的特征融合,通过注意力机制自适应分配各通道权重,从而获取更准确的视线方向。本方法在无约束的自然环境视线估计中,具有更好的精度表现。

    基于LSTM双流卷积神经网络的位姿估计方法、系统及介质

    公开(公告)号:CN113838135B

    公开(公告)日:2024-03-19

    申请号:CN202111181525.6

    申请日:2021-10-11

    Abstract: 本发明请求保护一种基于LSTM双流卷积神经网络的位姿估计方法、系统及介质,该方法包括步骤:S1,对彩色图像和深度图像进行预处理,将相邻的两帧彩色图像和深度图像分别进行级联,并且深度图像进一步采用MND编码预处理,最后将彩色图像和深度图像进行归一化处理;S2,将预处理完成的彩色图像和深度图像分别输入双流卷积神经网络的彩色流和深度流进行特征提取;S3,将彩色流输出的rgb feature map和深度流输出的depth feature map进行融合生成新的fusion feature map;S4,将新生成的fusion feature map进行全局均值池化处理;S5,利用LSTM神经网络,通过训练,预测当前位姿。结果表明本文提出的位姿估计模型在运动模糊和光线不足的情况下具有更高的精度和鲁棒性。

    一种人性化设计的电子移动设备手柄装置及使用方法

    公开(公告)号:CN116549957A

    公开(公告)日:2023-08-08

    申请号:CN202310576970.5

    申请日:2023-05-19

    Abstract: 本发明请求保护一种人性化设计的电子移动设备手柄装置及使用方法,属于电子设备技术领域。包括控制手柄、蓝牙模块、音箱和可调式手机夹持装置,所述蓝牙模块设于控制手柄上,所述音箱设于控制手柄上,所述可调式手机夹持装置和控制手柄呈滑动设置本发明属于电子设备技术领域,具体是一种人性化设计的电子移动设备手柄装置,有效的解决了目前市场上手柄实际使用过程中不足够人性化、需要操作人员根据电子设备的尺寸调整操作双手之间距离的现象,通过将伸缩式控制装置设定为固定式,将原有的中间夹持机构提升到手柄的上方,保证了用户在进行界面操作时手位置不便,提升用户体验感,保证用户操控设备的舒适度。

    基于时频域的卷积神经网络运动想象脑电信号识别方法

    公开(公告)号:CN109711383B

    公开(公告)日:2023-03-31

    申请号:CN201910012447.3

    申请日:2019-01-07

    Inventor: 胡章芳 张力 罗元

    Abstract: 本发明请求保护一种基于时频域的卷积神经网络运动想象脑电信号识别方法,包括以下步骤:S1,利用短时傅里叶变换将原始左右手运动想象脑电信号转换为二维时频图;S2,对得到的二维时频图设计了一种5层卷积神经网络结构,为了避免时间与频率信息的混杂,采取了一维卷积方式进行特征提取;S3,利用反向传播算法训练整个CNN网络;S4,以支持向量机作为整个模型的分类器,将支持向量机替换CNN中的输出层。本发明能够保证在脑电数据集中,提取的左右手运动想象脑电信号特征具有较高的识别率,鲁棒性好。

    近地搜索无人机的轨迹规划及动态避障方法

    公开(公告)号:CN115617076A

    公开(公告)日:2023-01-17

    申请号:CN202211369899.5

    申请日:2022-11-03

    Abstract: 本发明公开了一种近地搜索无人机的轨迹规划及动态避障方法,包括步骤:S1,针对三维空间建立八叉树数据结构离散化模型,并将跳点搜索(JPS)算法进行三维化扩展,使无人机基于静态环境生成无碰撞路径;S2,基于Lazy‑Theta*算法提出了一种路径长度优化法则,以此实现JPS算法多角度寻路,进一步缩短了无人机的实际规划路径;S3,通过基于minimun snap的七阶多项式插值法对优化路径进行平滑性处理,保证路径节点处的连续性;S4,通过虚拟引力场以及三维布雷森汉姆线算法对人工势场(APF)法进行改进,实现无人机在动态威胁冲突环境下的自主避障。本发明通过仿真实验验证了该融合式方案的性能。仿真结果表明,本发明提出融合式方案可以有效的解决无人机在执行低空飞行任务当中的路径规划以及自主避障问题。

    一种基于时空注意力机制的手语识别方法

    公开(公告)号:CN111091045B

    公开(公告)日:2022-08-23

    申请号:CN201911023322.7

    申请日:2019-10-25

    Abstract: 本发明公开了一种基于时空注意力机制的手语识别方法,首先将手语视频采样为具有统一长度的连续手语序列作为模型的输入。然后将视频帧序列输入到由3D残差块构成的空间注意力网络中,使得网络能够自动关注空间中的显著区域。随后将提取的卷积特征经过ConvLSTM卷积长短时记忆网络解析后提取出长时间的序列特征,同时分配不同视频帧的时间注意力权重生成视频的特征表示。最后,生成的特征表示经过Softmax分类器,以向量的形式输出分类类别。本发明能够降低冗余信息对识别的干扰,提高识别准确率。

    基于LSTM双流卷积神经网络的位姿估计方法、系统及介质

    公开(公告)号:CN113838135A

    公开(公告)日:2021-12-24

    申请号:CN202111181525.6

    申请日:2021-10-11

    Abstract: 本发明请求保护一种基于LSTM双流卷积神经网络的位姿估计方法、系统及介质,该方法包括步骤:S1,对彩色图像和深度图像进行预处理,将相邻的两帧彩色图像和深度图像分别进行级联,并且深度图像进一步采用MND编码预处理,最后将彩色图像和深度图像进行归一化处理;S2,将预处理完成的彩色图像和深度图像分别输入双流卷积神经网络的彩色流和深度流进行特征提取;S3,将彩色流输出的rgb feature map和深度流输出的depth feature map进行融合生成新的fusion feature map;S4,将新生成的fusion feature map进行全局均值池化处理;S5,利用LSTM神经网络,通过训练,预测当前位姿。结果表明本文提出的位姿估计模型在运动模糊和光线不足的情况下具有更高的精度和鲁棒性。

    一种基于注意力CNN Bi-GRU融合视觉信息的语音情感识别方法

    公开(公告)号:CN113643723A

    公开(公告)日:2021-11-12

    申请号:CN202110726187.3

    申请日:2021-06-29

    Abstract: 本发明公开了一种基于注意力CNN Bi‑GRU融合视觉信息的语音情感识别方法,包括步骤:S1,将语音信号经过预处理得到三维对数梅尔谱图;S2,利用三维对数梅尔谱图预训练3DRACNN语音网络提高泛化能力;S3,通过CNN和AGRUs分别提取面部静态外观特征和几何特征;S4,为了降低语音特征识别率低的问题,采用融合模型将语音特征依次与面部特征进行融合得到混合特征,并由KLDA过滤无关特征;S5,在模型训练的过程中通过更新参数最小化损失,同时通过算法进行优化,最后由softmax层进行情感分类。本发明能够有效解决情感识别模型识别率低以及泛化能力弱的问题,提高识别准确率和鲁棒性。

    基于注意力机制的多特征融合视线估计方法

    公开(公告)号:CN113642393A

    公开(公告)日:2021-11-12

    申请号:CN202110768272.6

    申请日:2021-07-07

    Abstract: 本发明请求保护一种基于注意力机制的多特征融合视线估计方法,该方法包括利用MTCNN算法对人脸和人脸关键点进行检测,从而获得视线估计所需的人脸和眼睛图片;利用基于组卷积通道和空间注意力机制的人脸和眼睛特征提取器,选择并增强人脸及双眼图片中的重要特征,并抑制与视线估计无关的信息;利用双眼特征融合网络和眼瞳特征融合网络,将双眼及瞳孔中心位置特征进行融合,并与人脸特征向量进行拼接以实现多特征融合,从而避免双眼非对称性及头部姿态估计不准确对视线估计的影响。通过在公开数据集MPIIGaze及EyeDiap上进行验证,并与当前主流的视线估计方法进行比较,本发明提出的视线估计方法具有更小的平均角误差,有效提高了自然场景中视线估计的精度和鲁棒性。

Patent Agency Ranking