-
公开(公告)号:CN106095829B
公开(公告)日:2019-08-06
申请号:CN201610381864.1
申请日:2016-06-01
Applicant: 华侨大学
IPC: G06F16/43
Abstract: 本发明涉及基于深度学习与一致性表达空间学习的跨媒体检索方法,针对图像与文本两种模态的跨媒体信息,从特征的选择及高度异构的两个特征空间的相似性估算这两个方法上入手,提出一个能教大幅度提高多媒体检索准确率的跨媒体检索方法。本发明所述的方法是一种针对图像与文本两种模态的多媒体信息相互检索方法,实现跨媒体检索准确率的较大幅度提高。本发明提出的模型中,采用经调整过的向量内积作为相似度度量算法,不仅考虑了两种不同模态特征向量的方向,而且在中心化后消除了指标量纲的影响,将向量中的每个元素减去元素的平均值,再计算去均值后的两个向量的相关性;能计算得到更为准确的相似度。
-
公开(公告)号:CN107203740A
公开(公告)日:2017-09-26
申请号:CN201710270419.2
申请日:2017-04-24
Applicant: 华侨大学
CPC classification number: G06K9/00288 , G06K2009/00322 , G06N3/08
Abstract: 本发明提供一种基于深度学习的人脸年龄估计方法,其步骤包括S1:建立深度学习网络模型;S2:采用分类的方式预训练所述深度学习网络模型使所述深度学习网络模型具有分类能力;S3:在步骤S2的基础上进行微调,使所述深度学习网络模型具有学习表观年龄和估计表观年龄的能力;S4:在步骤S3的基础上使用所述真实年龄数据集中80%的数据集作为训练集进行所述深度学习网络模型的微调,然后使用所述真实年龄数据集中20%的数据集作为测试集进行所述深度学习网络模型的测试;S5:在所述卷积神经网络模型中的最后一个全连接层的softmax输出值,构建间接回归的方法估计年龄值。S6:输入被测人脸图像,得出所述被测人脸图像的人脸年龄。
-
公开(公告)号:CN117576489B
公开(公告)日:2024-04-09
申请号:CN202410065206.6
申请日:2024-01-17
Applicant: 华侨大学
IPC: G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/084 , G06V10/766 , G06V10/25
Abstract: 本发明提供了智能机器人鲁棒实时目标感知方法、装置、设备及介质,包括获取由采集设备采集到的智能机器人使用场景数据集,并对所述智能机器人使用场景数据集进行标注划分处理,生成训练集和测试集;调用训练好的鲁棒实时目标感知模型对所述智能机器人使用场景数据集进行目标跟踪预处理,生成感知信息;根据所述感知信息,生成感知结果。旨在更加鲁棒、实时且稳定的跟踪感知目标,从而为智能机器人的准确执行任务提供了可靠的基础支持。
-
公开(公告)号:CN117058472B
公开(公告)日:2024-02-20
申请号:CN202311316106.8
申请日:2023-10-12
Applicant: 华侨大学
IPC: G06V10/764 , G06V10/82 , G06V10/25 , G06V10/766 , G06V10/80 , G06N3/0464 , G06N3/045 , G06N3/08
Abstract: 本发明提供了基于自注意力机制的3D目标检测方法、装置、设备,涉及人工智能和计算机视觉技术领域,针对在两阶段网络模型中第一阶段得到感兴趣区域后点与点之间的信息密度不高问题,提出了一种基于自注意力机制的3D目标检测算法,通过增强点与点之间的交互信息密度,进而提高感受野的覆盖范围。在KITTI数据集上的实验证明,该方法在汽车、行人、自行车类数据集上的平均检测精度有了较大的提升,尤其在小目标稀疏的点中效果显著,这进一步证实了该算法的有效性。
-
公开(公告)号:CN117115573A
公开(公告)日:2023-11-24
申请号:CN202311388102.0
申请日:2023-10-25
Applicant: 华侨大学
IPC: G06V10/764 , G06V10/26 , G06V10/80 , G06V10/774 , G06V10/52
Abstract: 本发明提供了一种有毒生物图像分类识别方法、装置、设备及存储介质,先通过获取图像样本,调用基于均衡采样策略和逆向采样策略交叉训练过的分类模型基于所述图像样本的分辨率进行分割成多组切块;接着,基于特征提取的阶段调整所述多组切块的数量以及采样频率进行特征提取,以生成不同阶段的多尺度特征图;最后,对所述不同阶段的多尺度特征图进行融合后通过融合特征分类器进行预测,以生成所述图像样本的预测结果,其中,预测结果为所述图像样本是否为有毒生物,通过使用自适应样本平衡采样训练策略,缓解训练集类别样本数量不均衡造成的影响,有效的提高了在对有毒生物识别时的识别率。
-
公开(公告)号:CN115527064A
公开(公告)日:2022-12-27
申请号:CN202211152826.0
申请日:2022-09-21
Applicant: 华侨大学
IPC: G06V10/764
Abstract: 本发明实施例提供一种基于多阶段ViT与对比学习的毒蘑菇细粒度图像分类方法,涉及图像识别技术领域。图像分类方法包含S1获取待识别图像。S2根据待识别图像,进行图像重叠划分,获取多个部分重叠的图像块。S3根据多个部分重叠的图像块,获取嵌入序列。S4将嵌入序列输入预先训练好的基于池化的多阶段ViT编码器中进行编码,获取待识别图像的特征编码。S5将特征编码输入分类器中进行分类,获取待识别图像的识别结果。预先训练好的基于池化的多阶段ViT编码器包含间隔设置的子编码器和池化层。子编码器包含L层transformer block,用以将嵌入序列编码成特征图。池化层配置于子编码器之间,用以调整特征图的空间尺寸。基于池化的多阶段ViT编码器能够大大减小了计算开销。
-
公开(公告)号:CN106504254B
公开(公告)日:2020-03-10
申请号:CN201610903015.8
申请日:2016-10-17
Applicant: 华侨大学
IPC: G06T7/11
Abstract: 本发明公开了一种基于空间混合模型的颅脑磁共振图像分割方法,包括:对输入的颅脑磁共振图像进行预处理,得到剔除非脑部组织后的图像;将预处理后的图像数据转换成行向量作为输入向量;对向量化后的图像数据利用基于空间关系的Inverted Dirichlet混合模型进行建模,并采用k‑means方法进行模型的初始化;采用贝叶斯变分推导技术估算混合模型的相关参数;通过计算后验概率从而确定各个像素点的所属类别,并得到新的标签向量;将标签向量作为输出向量并转换成灰度矩阵,从而得到最终的分割结果。本发明的技术方案对颅脑磁共振图像的分割效果出色、鲁棒性强,能够提高医学影像诊断的准确性。
-
公开(公告)号:CN105956571B
公开(公告)日:2019-03-12
申请号:CN201610317460.6
申请日:2016-05-13
Applicant: 华侨大学
IPC: G06K9/00
Abstract: 本发明的一种人脸图像的年龄估计方法,该方法包括五个部分:(1)图像的分块;(2)用PCA算法学习分块处理后的矩阵得到卷积操作的卷积核;(3)然后用PCA算法学习得到的卷积核进行卷积操作;(4)用二值化的方式在第二个卷积层后面进行非线性处理;(5)用直方图统计的方法进行特征抽取。该方法提取特征后用非线性支持向量回归K‑SVR(Kernel function Support Vector Regression)来估计年龄值,经过实验表明可以大大提高年龄估计的准确率。
-
公开(公告)号:CN106709921A
公开(公告)日:2017-05-24
申请号:CN201611242922.9
申请日:2016-12-29
Applicant: 华侨大学
IPC: G06T7/11
CPC classification number: G06T2207/10024
Abstract: 本发明涉及一种基于空间Dirichlet混合模型的彩色图像分割方法,所提出的统计模型基于Dirichlet混合模型,Dirichlet分布是一个多元泛化的Beta分布,对比其他分布(例如:高斯分布、)它能够包含对称与非对称模态,因此可以灵活处理各种图像以及体现出较好的分割准确率。本发明在Dirichlet混合模型中融入空间邻域特征,从而体现出较好的鲁棒性。在求解Dirichlet混合模型参数过程中,本发明采用基于变分贝叶斯推断的方法,使得模型求解更加准确高效。克服了现有技术的方法采用的最大似然估计(ML)和最大后验概率估计(MAP)存在的不足:这些方法通常容易在求解模型过程中陷入局部极小值,而且会造成迭代次数过多。
-
公开(公告)号:CN106023236A
公开(公告)日:2016-10-12
申请号:CN201610431135.2
申请日:2016-06-16
Applicant: 华侨大学
IPC: G06T7/00
CPC classification number: G06T2207/10088 , G06T2207/30016
Abstract: 本发明涉及一种基于截断Dirichlet过程无限Student’s t混合模型的脑部核磁共振图像分割方法,基于Dirichlet过程无限Student’s t混合模型,将无限Student’s t混合模型中的分量数假设为预设的图像的分割数K,然后利用期望最大化算法对模型进行求解,再利用贝叶斯最大后验概率准则进行图像分割。本发明所述的方法中,假设的Student’s t混合模型直接对应到脑部核磁共振图像不同的部分,而且Student’s t分布的高尾部特性决定了模型有较好的抗噪效果,从而实现脑部核磁共振图像分割。求解Dirichlet过程无限Student’s t混合模型的过程中,本发明用简单高效的期望最大化算法对基于截断Dirichlet过程无限Student’s t混合模型进行求解,使模型的求解变得更易实现。本发明的实施,能够在PC端对一幅脑部核磁共振图像快速自动地进行分割。
-
-
-
-
-
-
-
-
-