-
公开(公告)号:CN119850956A
公开(公告)日:2025-04-18
申请号:CN202411988410.1
申请日:2024-12-31
Applicant: 中科合肥技术创新工程院 , 合肥大学
IPC: G06V10/26 , G06V10/20 , G06V10/774 , G06V10/764 , G06N3/0464 , G06N3/048 , G06N3/0455
Abstract: 本发明公开了一种基于高效多尺度特征自注意力解码器与增强跳跃连接的医学图像分割模型及方法,构建了一个轻量、高效的多尺度特征自注意力模块,该模块在图像的上下采样过程中分别采用瓶颈卷积,并在这两个过程之间依次执行两个自注意力机制。引入了一种线性可变形注意力引导模块,以增强通过跳跃连接传递的特征图。两者结合形成的EMFSD解码器再与金字塔视觉变换器结合,最终形成医学图像分割模型(PVT‑EMFSD)。该模型采用层次结构,从层次视觉编码器中利用多级特征,沿用U型网络架构逐步增强特征图的语义信息。在三个基准数据集上进行了广泛实验表明,该方法在医学图像分割任务中优于现有方法,展现了竞争力的性能。
-
公开(公告)号:CN119785437A
公开(公告)日:2025-04-08
申请号:CN202411988014.9
申请日:2024-12-31
Applicant: 中科合肥技术创新工程院 , 合肥大学
IPC: G06V40/20 , G06V10/44 , G06V10/764 , G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/045 , G06N3/048
Abstract: 用于动态全景教室场景的双注意力学生行为检测与识别模型及方法,属于行为检测与识别技术领域。在全景教室中,准确检测学生的课堂行为对于提升教育质量和个性化教学具有重要意义。本发明提出一种以YOLOv10n作为基础模型构建得到EDA‑SBRNet模型,使用HGNet网络作为特征提取器,并引入ParNet来增强模型训练速度的同时丰富了特征空间的多样性,最后在检测层的末端加入C2fCID块,来提升模型在复杂场景中对目标的检测与定位精度。与其他主流课堂行为检测模型相比,EDA‑SBRNet在检测性能、模型参数量、计算量和推理时间等方面均表现出色,展现其在实际应用中的优势。
-
公开(公告)号:CN118646646A
公开(公告)日:2024-09-13
申请号:CN202410870553.6
申请日:2024-07-01
Applicant: 合肥大学
IPC: H04L41/0677 , G06N3/042 , G06N3/08
Abstract: 本发明公开了一种基于图注意力网络的网络异常根因定位方法及装置,该方法包括:获取通信网络的时间片数据,一个所述时间片数据中包括目标变量的变量值和全部观测变量的变量值;构建节点关系矩阵即邻接矩阵A和节点特征矩阵X;将邻接矩阵A和节点特征矩阵X输入到预设的图注意力网络GAT,获得第一网络异常根因定位结果;将节点特征矩阵X输入到预设的集成模块中,获得第二网络异常根因定位结果;对于第一和第二网络异常根因定位结果,基于观测变量的数据波动情况进行结果补强,最终确定网络异常根因定位结果。“GAT+集成模型+补强”结合,有效提高了网络异常根因定位的准确性。
-
公开(公告)号:CN118538212A
公开(公告)日:2024-08-23
申请号:CN202410622595.8
申请日:2024-05-20
Applicant: 合肥大学
IPC: G10L15/20 , G10L15/02 , G10L15/16 , G10L15/06 , G10L15/08 , G10L25/30 , G06F18/214 , G06V10/44 , G06V10/774 , G06N3/045 , G06N3/084 , G06N3/096 , G06N3/0464 , G06N3/0985 , G06F123/02
Abstract: 本发明属于水声信号识别技术领域,公开了一种基于域适应的水声信号识别方法,本发明的水声信号识别方法,为解决现有方法在水下场景中无法提取有效的特征表示以及无法确保识别方法的鲁棒性而导致识别精度低的问题。通过以下方法实现水声信号的识别,包括:1、对获取的水声信号数据集的预处理;2、构建集成注意力机制的师生域适应网络模型;3、使用动态迭代优化的方式训练构建网络模型;4、利用训练好的模型对待识别的图像进行预测,实现水声信号的识别;上述方法能够提高水声信号识别准确率。
-
公开(公告)号:CN119579448A
公开(公告)日:2025-03-07
申请号:CN202411603476.4
申请日:2024-11-12
Applicant: 合肥大学
Abstract: 带有拉普拉斯增强金字塔的多通道光照自适应网络模型及低光图像增强方法,属于低光图像增强处理技术领域。频率信息优化和亮度自适应对于低光图像增强和曝光校正至关重要。本发明提出的该网络由两个模块协同工作。首先,设计了拉普拉斯增强金字塔(LEP),将图像分解为不同频率的分量,并优化这些分量以进行初步增强。随后,设计了多通道光照自适应Transformer(MIAT),对图像的颜色和多通道伽马校正参数进行查询,以进一步精细调整,生成增强后的图像。本发明的MIANet仅约0.17M参数,处理分辨率为600×400的图像时,平均增强处理时间仅为0.007秒,在LLIE和曝光校正基准测试中优于最新的先进方法。
-
公开(公告)号:CN118674734A
公开(公告)日:2024-09-20
申请号:CN202410778122.7
申请日:2024-06-17
Applicant: 合肥大学
IPC: G06T7/11 , G06T7/00 , G06N3/0464 , G06V10/80 , G06F17/10
Abstract: 一种用于医学图像分割的深度卷积水平集网络,在U‑Net模型预分割部分,构建了新的并行空洞卷积序列模块,同时捕获局部和全局的特征信息,加强特征提取,最小化下采样过程图像信息的损失;在解码器端构建了混合注意力模块,可以自动学习选择最重要的特征并加权,减少冗余信息的影响,帮助网络上采样恢复信息重建图像;将U‑Net的输出作为水平集方法中能量函数的一个牵引项,水平集方法作为后处理步骤,接受来自U‑Net的先验信息;构建基于对数函数和多项式函数的距离正则项和边缘停止函数,通过预测图像感兴趣区域,牵引项中包含目标的边缘信息,通过最小化能量函数,水平集方法将更准确的演化曲线,来进一步优化分割图像边界。
-
-
-
-
-