-
公开(公告)号:CN119573714A
公开(公告)日:2025-03-07
申请号:CN202411811087.0
申请日:2024-12-10
Applicant: 西安理工大学
Abstract: 本发明公开了基于改进TD3算法的VSLAM方法,包括:移动机器人的传感器进行数据采集,并对数据进行融合得多模态数据;对多模态数据处理后构建局部地图;使用余弦相似度进行帧间匹配,通过匹配关系估计相邻帧之间的相对位姿;并判断当前帧是否为关键帧并进行存储;利用当前帧的相对位姿结合传感器数据,对局部地图更新;利用当前帧与关键帧的相似性进行闭环检测,修正累计位姿误差;启动全局g2o图优化算法,优化相对位姿;将优化后的相对位姿以及地图信息输入改进后的TD3模型,生成全局地图的最优导航策略。本发明方法提升了地图构建的质量,减少累计误差,进一步提高了VSLAM在复杂环境中的鲁棒性和性能。
-
公开(公告)号:CN118570598A
公开(公告)日:2024-08-30
申请号:CN202410723213.0
申请日:2024-06-05
Applicant: 西安理工大学
IPC: G06V10/80 , G06V10/82 , G06V10/40 , G06N3/0455 , G06N3/045 , G06N3/044 , G06N3/0464 , G06V10/44 , G06V10/74 , G06N3/048 , G06N3/084
Abstract: 本发明公开了基于Transformer多粒度特征融合的图像描述方法,包括:处理图像数据,将数据划分为训练集、验证集和测试集;构建多尺度特征提取模块MVIT;构建多特征融合模块HF进行视觉特征向量的融合;构建文本解码器,将提取的视觉特征信息和文本信息通过因果注意力机制进行融合,生成最终的图像描述内容;通过构造多尺度特征提取模块和多层级融合模块,以及文本解码器,搭建一个完整的基于Transformer的多粒度特征融合图像描述生成模型,将待描述的图像输入该模型中即可生成图像描述。本发明通过多粒度特征融合技术,能够更全面地捕获图像中的局部细节、物体关系以及全局上下文信息,从而生成更准确、更详细的图像描述。
-
公开(公告)号:CN118446216A
公开(公告)日:2024-08-06
申请号:CN202410474746.X
申请日:2024-04-19
Applicant: 西安理工大学
IPC: G06F40/295 , G06F18/213 , G06F18/214 , G06F18/25 , G06N7/01 , G06N3/045 , G06N3/0442 , G06N3/0464 , G06N3/0499 , G06N3/0895 , G06N3/084
Abstract: 本发明公开了基于多特征融合的医学文本命名实体识别方法,构建了基于医学CMT‑BERT的特征表示和结合BiLSTM+TEXTCNN+CRF的模型架构,能够更准确地识别中文医学文本中的实体,更好地捕捉医学文本中的上下文信息和全局特征,从而提高命名实体识别的准确性;在中文医学文本的命名实体识别领域具有重要的实际价值,能够提高智慧医疗系统的效率和精确性,为医疗领域的决策支持和知识发现提供强有力的支持。
-
公开(公告)号:CN222734434U
公开(公告)日:2025-04-08
申请号:CN202421204036.7
申请日:2024-05-29
Applicant: 西安理工大学
Abstract: 本实用新型公开了一种带人脸识别的图书馆情景感知信息检索设备,本实用新型涉及图书馆应用设备技术领域。该带人脸识别的图书馆情景感知信息检索设备,包括机箱,所述机箱开口端设置有检修门,所述机箱表面且靠近顶部位置开设有第一通孔,所述述机箱表面且位于所述第一通孔下方开设有第二通孔,还包括:控制主机,所述控制主机设置于所述机箱内腔底部表面,所述控制主机用于外接图书馆中的监控和储存图书的存放位置信息;识别组件,本实用新型既能人脸识别用户的信息,又能方便用户感知图书馆内的图书位置、空座等信息,从而能够为用户提供便捷的图书馆资源查询和导航服务,进而能够提升图书馆的服务质量和效率。
-
-
-