-
公开(公告)号:CN113642619B
公开(公告)日:2023-12-26
申请号:CN202110861484.9
申请日:2021-07-29
Applicant: 华侨大学
IPC: G06V10/774 , G06V10/22 , G06V20/62 , G06V10/764
Abstract: 本发明提供了一种文字识别模型的训练方法、装置、设备及可读存储介质,包括:调用合成数据集对初始学习模型进行训练,以获得中间模型;调用真实数据集对所述中间模型进行训练,以获得文字识别模型,其中,所述文字识别模型用于接收图像采集装置采集到的图像,并根据所述图像生成文字对象的识别信息及其对应的位置信息。解决了现有技术无法识别不规则分布或者弯曲的文字。
-
公开(公告)号:CN106023236B
公开(公告)日:2019-06-04
申请号:CN201610431135.2
申请日:2016-06-16
Applicant: 华侨大学
IPC: G06T7/10
Abstract: 本发明涉及一种基于截断Dirichlet过程无限Student’s t混合模型的脑部核磁共振图像分割方法,基于Dirichlet过程无限Student’s t混合模型,将无限Student’s t混合模型中的分量数假设为预设的图像的分割数K,然后利用期望最大化算法对模型进行求解,再利用贝叶斯最大后验概率准则进行图像分割。本发明所述的方法中,假设的Student’s t混合模型直接对应到脑部核磁共振图像不同的部分,而且Student’s t分布的高尾部特性决定了模型有较好的抗噪效果,从而实现脑部核磁共振图像分割。求解Dirichlet过程无限Student’s t混合模型的过程中,本发明用简单高效的期望最大化算法对基于截断Dirichlet过程无限Student’s t混合模型进行求解,使模型的求解变得更易实现。本发明的实施,能够在PC端对一幅脑部核磁共振图像快速自动地进行分割。
-
公开(公告)号:CN106778655A
公开(公告)日:2017-05-31
申请号:CN201611224676.4
申请日:2016-12-27
Applicant: 华侨大学
Abstract: 本发明涉及一种基于人体骨架的入口尾随进入检测方法,在入口前预设预警区域,行人进入预警区域后,通过摄像头实时检测行人的人体骨架;在预警区域内对受测行人规划尾随警戒区域,检测尾随警戒区域内的其他行人;如果其他行人的人体骨架满足报警规则,则发生报警。本发明实现了视频监控中行人尾随进入事件的智能监控,有效地对行人尾随进入这一高层次语义事件进行识别。同时为了提高行人检测的准确率和降低误检率,通过人体骨架交互的判断,对同行人进行识别,剔除因为同行事件引起的误警,进而实现对入口处,行人尾随进入的检测。本发明所述的方法实时性好,成本低,计算量少。而且采用低成本的深度摄像头,利于实施与推广。
-
公开(公告)号:CN119625436A
公开(公告)日:2025-03-14
申请号:CN202510147874.8
申请日:2025-02-11
Applicant: 华侨大学 , 厦门狄耐克智能科技股份有限公司
Abstract: 本发明提供了一种可解释性细粒度图像识别方法、装置、设备及介质,涉及细粒度图像识别技术领域,本方法采用双分支结构框架,结合特征融合和原型学习进行细粒度图像分类。其中,特征提取层通过自注意力机制捕获图像中的复杂模式和长距离依赖,同时引入特征选择融合模块,有效选择原型学习的信息标记,确保学习到的原型更注重前景。原型学习层设计了双分支结构,分别处理和学习图像的全局原型和局部原型,提高网络的准确率,并从全局的角度解释模型分类结果。全连接层实现最终的分类决策,通过加权和得到最终分类概率。旨在解决现有深度学习模型在细粒度图像分类问题上的黑盒特性,提高模型在高风险领域的应用可信度。
-
公开(公告)号:CN113609948B
公开(公告)日:2023-09-05
申请号:CN202110861491.9
申请日:2021-07-29
Applicant: 华侨大学
IPC: G06V40/20 , G06V20/40 , G06V10/62 , G06V10/762 , G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/094
Abstract: 本发明提供了一种视频时序动作的检测方法、装置及设备,方法包括:获取视频数据,并提取所述视频数据的视频特征;将所述视频特征输入至锚分支网络以及无锚分支网络,以获取所述锚分支网络输出的第一输出结果,及所述无锚分支网络输出的第二输出结果,其中,所述锚分支网络以及所述无锚分支网络并行处理所述视频特征;调用对齐损失函数对所述第一输出结果及所述第二输出结果进行融合处理,生成时序动作定位结果集。解决了现有技术中对数据集的动作标注往往很模糊的问题。
-
公开(公告)号:CN111915613B
公开(公告)日:2023-06-13
申请号:CN202010798878.X
申请日:2020-08-11
Applicant: 华侨大学
IPC: G06V10/26 , G06N3/0464 , G06T5/00 , G06V10/82 , G06V10/80 , G06T7/10 , G06V20/70 , G06V10/764
Abstract: 本发明提供一种图像实例分割方法、装置、设备及存储介质,方法包括:提取图像的特征,获取特征图;通过自注意力模块提取特征图的多尺度信息,得到不同尺度的特征图,然后与通过1×1卷积调整维度得到的特征图点乘,为特征图引入像素级注意力;压缩特征图的空间维度,将特征图实数化,对低层特征图进行加权;将加权后的特征图与高层特征图融合,得到新的特征图;通过目标检测和语义分割对融合后特征图进行分类,获取目标检测和语义分割特征图;基于获取目标检测和语义分割特征图进行图像分割,获得分割结果。本发明通过自注意力模块和路径增强模块为后续特征融合提供了更为优秀的语义指导,为后续网络的训练学习减少了一定的噪声影响。
-
公开(公告)号:CN112733912B
公开(公告)日:2023-06-09
申请号:CN202011634407.1
申请日:2020-12-31
Applicant: 华侨大学
IPC: G06V10/82 , G06V10/764 , G06V10/774 , G06V10/80 , G06N3/0464 , G06N3/0475 , G06N3/094
Abstract: 本发明涉及一种基于多粒度对抗损失的细粒度图像识别方法,包括以下步骤:使用区域混淆机制破坏图像全局信息,并进行图像增强,迫使网络更加关注图像区域信息;使用渐进式学习策略在深度神经网络的不同层提取特征,联合不同粒度的图像特征,对每一个特征和原图特征联合进行分类;获取多粒度对抗损失函数,来降低因破坏图像的全局结构而引起的噪声。本发明将数据的不同粒度区域混淆,实现了数据增强,迫使网络关注到不同粒度图像的局部信息,采用渐进式学习策略,对每个阶段的特征进行学习且连接最后S个阶段的特征从而实现多粒度信息互补,构建多粒度对抗损失降低因破坏图像的全局结构而引入的噪声,因此可以更准确和高效的识别子类图像。
-
公开(公告)号:CN115439790A
公开(公告)日:2022-12-06
申请号:CN202211151940.1
申请日:2022-09-21
Applicant: 华侨大学
IPC: G06V20/40 , G06V10/764
Abstract: 本发明实施例提供一种基于级联的种子区域生长模块的弱监督时序动作定位方法,涉及视频动作识别技术领域。其中,这种弱监督时序动作定位方法包含步骤S1至步骤S5。S1、获取待识别视频。S2、根据待识别视频,提取时序特征。S3、将时序特征输入预先训练好的弱监督时序动作分类模型,获取待识别类激活序列,并根据待识别类激活序列,获取视频级动作分类得分。S4、获取动作分类阈值,并根据动作分类阈值对视频级分类得分进行判断,获取待识别视频包含的动作类别。S5、根据动作类别和待识别类激活序列,获取动作类别在待识别视频中的起止时刻。解决现有的弱监督时序动作定位方法会陷入局部最优的问题,大大提高了视频中动作识别的精确度。
-
公开(公告)号:CN112733912A
公开(公告)日:2021-04-30
申请号:CN202011634407.1
申请日:2020-12-31
Applicant: 华侨大学
Abstract: 本发明涉及一种基于多粒度对抗损失的细粒度图像识别方法,包括以下步骤:使用区域混淆机制破坏图像全局信息,并进行图像增强,迫使网络更加关注图像区域信息;使用渐进式学习策略在深度神经网络的不同层提取特征,联合不同粒度的图像特征,对每一个特征和原图特征联合进行分类;获取多粒度对抗损失函数,来降低因破坏图像的全局结构而引起的噪声。本发明将数据的不同粒度区域混淆,实现了数据增强,迫使网络关注到不同粒度图像的局部信息,采用渐进式学习策略,对每个阶段的特征进行学习且连接最后S个阶段的特征从而实现多粒度信息互补,构建多粒度对抗损失降低因破坏图像的全局结构而引入的噪声,因此可以更准确和高效的识别子类图像。
-
公开(公告)号:CN106709921B
公开(公告)日:2020-06-09
申请号:CN201611242922.9
申请日:2016-12-29
Applicant: 华侨大学
IPC: G06T7/11
Abstract: 本发明涉及一种基于空间Dirichlet混合模型的彩色图像分割方法,所提出的统计模型基于Dirichlet混合模型,Dirichlet分布是一个多元泛化的Beta分布,对比其他分布(例如:高斯分布、)它能够包含对称与非对称模态,因此可以灵活处理各种图像以及体现出较好的分割准确率。本发明在Dirichlet混合模型中融入空间邻域特征,从而体现出较好的鲁棒性。在求解Dirichlet混合模型参数过程中,本发明采用基于变分贝叶斯推断的方法,使得模型求解更加准确高效。克服了现有技术的方法采用的最大似然估计(ML)和最大后验概率估计(MAP)存在的不足:这些方法通常容易在求解模型过程中陷入局部极小值,而且会造成迭代次数过多。
-
-
-
-
-
-
-
-
-