-
公开(公告)号:CN119850894A
公开(公告)日:2025-04-18
申请号:CN202411908371.X
申请日:2024-12-24
Applicant: 东北大学
Abstract: 本发明计算机视觉技术领域,公开一种基于关联指导网络的长期视觉定位方法。模型训练阶段包括感知网络训练和概念网络训练;概念网络训练完成后,概念网络作为预训练模型对感知网络进行训练,概念网络同时进行优化;关联指导机制进行信息交互;图像检索阶段,采用训练完成后的感知网络进行图像检索。该发明通过领域自适应学习及关联指导机制将概念网络中的特征用于指导感知网络中的特征学习,使模型最后训练得到的特征在环境变化下具有鲁棒性。此外,本发明使用了一种不需要额外数据构成的概念数据库用于对概念网络进行自启发的学习,以更好的对感知网络进行域特征指导,从而提高最终的图像检索性能。
-
公开(公告)号:CN119785341A
公开(公告)日:2025-04-08
申请号:CN202411878571.5
申请日:2024-12-19
Applicant: 东北大学
IPC: G06V20/64 , G06N3/045 , G06V10/80 , G06V10/82 , G06N3/0464
Abstract: 本发明属于计算机视觉技术领域,公开了一种基于密度的自适应混合点云场景识别方法。首先,设计一个两阶段近邻点搜索模块,基于密度动态调整不同分布的点云的邻域大小。在此基础上,提出一个动态局部特征聚合网络,结合密度驱动的邻接矩阵,确保精确提取局部细节。此外,进一步提出一种高效的对比增强线性注意力网络,使模型能够捕获更具判别性的全局上下文特征,更好地进行场景建模。最后,结合体素特征提取来抵抗局部噪声干扰,并将逐点特征融合到体素特征中,来补偿体素化过程带来的细节损失。在数据集上的大量实验表明,本发明实现了最先进的点云场景识别结果,具有出色的鲁棒性和泛化性,验证了算法的有效性。
-
公开(公告)号:CN118470241A
公开(公告)日:2024-08-09
申请号:CN202410517685.0
申请日:2024-04-28
Applicant: 东北大学
Abstract: 本发明属于神经隐式表征及视觉SLAM技术领域,公开了一种基于体素四面体编码的神经隐式SLAM方法。根据3D点表征场景分别进行体素嵌入和四面体网格编码后,二者拼接,将整个场景建模成可学习的网格特征向量构成的编码空间,得到几何编码和颜色编码;几何编码和颜色编码分别经对应的解码器解码,通过体渲染生成结果与真实结果生成损失函数;采用经典的滑动窗口机制,不断优化当前帧之前的几个关键帧,当关键帧数量超过窗口的最大容量时,从滑动窗口中移除损失最低的关键帧,从而确保滑动窗口中的关键帧数量不超过7帧,保证运行效率。我们的方法能够在Replica和ScanNet数据集上实现准确的相机跟踪,并产生高质量的重建结果。
-
公开(公告)号:CN119313839A
公开(公告)日:2025-01-14
申请号:CN202411429156.1
申请日:2024-10-14
Abstract: 本发明属于元宇宙物体建模技术领域,公开一种基于人在回路语义矫正和超二次曲面参数分离初始化的元宇宙物体数字化方法。通过提取图像平面特征、点特征和语义特征,基于人在回路语义矫正对获取的语义特征中的漏检和误检进行手动矫正;通过点和平面与相机之间的约束进行相机初始位姿估计;根据相机初始位姿,获取超二次曲面位姿参数;通过筛选可靠地图点,对物体所属的地图点进行最小凸包构建后估计超二次曲面的形状参数;通过局部单应性矩阵将矫正结果关联融合到后续帧中,并和构建的局部地图进行关联;本发明通过联合特征点,平面和超二次曲面约束对相机位姿进行优化,提高相机定位精度,最后输出一个超二次曲面表示物体的几何语义地图。
-
公开(公告)号:CN117953053A
公开(公告)日:2024-04-30
申请号:CN202311735305.2
申请日:2023-12-15
Applicant: 东北大学
IPC: G06T7/73 , G06F16/53 , G06V10/26 , G06V20/70 , G06V10/82 , G06V10/44 , G06N3/0455 , G06N3/045 , G06N3/0475 , G06N3/094
Abstract: 本发明属于视觉识别定位技术领域,公开了一种基于图像检索双域语义域适应的长期视觉定位方法。建立双域体系结构网络模型,构成自适应三重特征损失函数、循环一致损失函数、语义交叉熵损失函数、三重语义交叉熵损失函数、域特征一致损失函数、SAM损失函数六种函数更新双域体系结构网络模型;更新后得到最终双域体系结构网络模型,进行视觉定位。该发明所提出的框架只需要在虚拟数据集Virtual KITTI 2上进行训练而不需要引入其他真实数据集进行训练,就可以使模型具有很好的域适应能力并可以在其他数据集上取得良好的效果,从而提高最终的图像检索性能。
-
-
-
-