-
公开(公告)号:CN112307919B
公开(公告)日:2023-03-24
申请号:CN202011137363.1
申请日:2020-10-22
Applicant: 福州大学
IPC: G06V30/14 , G06V30/32 , G06V30/18 , G06V30/148 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及一种基于改进YOLOv3的单证图像中数字信息区域识别方法,包括步骤:获取手写数字图片,并对获取的手写数字图片集合进行预处理与标注,得到训练集;训练YOLOv3网络,用以检测和识别单证图像手写体数字信息区域;训练卷积神经网络CNN,用以识别单个手写体数字;用训练好的YOLOv3网络和卷积神经网络模型CNN对单证图像中手写数字信息区域的进行检测识别和重识别。本发明有效提升了复杂场景下单证图像中手写数字信息识别的准确率。
-
公开(公告)号:CN112613479A
公开(公告)日:2021-04-06
申请号:CN202110001577.4
申请日:2021-01-04
Applicant: 福州大学
Abstract: 本发明涉及一种基于轻量流式网络和注意力机制的表情识别方法,包括以下步骤:步骤S1:获取表情图像数据集,并预处理;步骤S2:构建包含注意力机制的轻量流式网络,并在网络的最后通过交叉熵损失函数进行分类;步骤S3根据预处理后的表情图像数据集训练包含注意力机制的轻量流式网络;步骤S4:将待测图像数据输入训练后的包含注意力机制的轻量流式网络,得到识别结果。本发明能够有效地对表情图像进行分类,提升了表情图像分类的效果。
-
公开(公告)号:CN112307919A
公开(公告)日:2021-02-02
申请号:CN202011137363.1
申请日:2020-10-22
Applicant: 福州大学
Abstract: 本发明涉及一种基于改进YOLOv3的单证图像中数字信息区域识别方法,包括步骤:获取手写数字图片,并对获取的手写数字图片集合进行预处理与标注,得到训练集;训练YOLOv3网络,用以检测和识别单证图像手写体数字信息区域;训练卷积神经网络CNN,用以识别单个手写体数字;用训练好的YOLOv3网络和卷积神经网络模型CNN对单证图像中手写数字信息区域的进行检测识别和重识别。本发明有效提升了复杂场景下单证图像中手写数字信息识别的准确率。
-
公开(公告)号:CN110032989B
公开(公告)日:2022-07-08
申请号:CN201910327555.X
申请日:2019-04-23
Applicant: 福州大学
IPC: G06V30/412 , G06V30/413 , G06V30/18 , G06V30/164 , G06V30/168 , G06V30/19 , G06K9/62
Abstract: 本发明涉及一种基于框线特征和像素分布的表格文档图像分类方法,首先对待分类图像进行灰度化和二值化,接着对得到的二值图像进行基于连通域分析的框线增强操作,对框线增强之后的图像进行基于深度学习方法的图像去噪;对经过预处理的待测图像,用基于形态学的直线检测方法分别检测并提取出横、纵框线,并将其细化,然后采用基于Npcanny的直线检测方法获取框线条数信息;对横框线图像进行水平方向投影,对纵框线进行垂直方向投影,并记录投影后的位置以及像素值,将得到的框线坐标与长度信息与模板库中已录入的标准模板信息进行匹配,筛选出与待分类图像相似度最高的模板图像,最后输出待分类图像的分类结果。本发明能够有效地对表格文档图像进行分类。
-
公开(公告)号:CN112699902A
公开(公告)日:2021-04-23
申请号:CN202110031134.X
申请日:2021-01-11
Applicant: 福州大学
Abstract: 本发明涉及一种基于双线性注意力池化机制的细粒度敏感图像检测方法,包括以下步骤:步骤S1:获取敏感图像,并对获取的敏感图片集合进行数据清洗,得到NSFW敏感图像训练数据集;步骤S2:并将NSFW敏感图像训练数据集输入细粒度敏感图像智能审核网络模型,进行特征提取,生成特征图和注意力图;步骤S3:根据得到的注意力图对NSFW训练集进行基于注意力机制的数据增强,并对图像进行注意力裁剪和注意力丢弃;步骤S4:通过双线性注意力池化机制将聚合特征图和注意力图生成局部特征图,并通过卷积和池化提取局部特征,将所有局部特征组合成最终特征;步骤S5:根据最终特征预测敏感图像类别。本发明能够有效提高对难样本场景敏感图像的检测正确率。
-
公开(公告)号:CN112183419A
公开(公告)日:2021-01-05
申请号:CN202011070119.8
申请日:2020-10-09
Applicant: 福州大学
Abstract: 本发明涉及一种基于光流生成网络和重排序的微表情分类方法。首先获取微表情数据集,提取出起始帧和峰值帧,并进行预处理;训练光流生成网络,根据所有的起始帧和峰值帧生成其光流特征;接着将得到的光流图像,按照LOSO原则切分成对应的训练集和测试集,输入残差网络进行训练;最后对残差网络初步分类得到的结果进行重排序,得到精度更高的最终结果。
-
公开(公告)号:CN110033471A
公开(公告)日:2019-07-19
申请号:CN201910317129.8
申请日:2019-04-19
Applicant: 福州大学
Abstract: 本发明涉及一种基于连通域分析和形态学操作的框线检测方法。首先对读入的待检测表格文档图像进行灰度化,将得到的灰度图像二值化;然后对得到的二值图像进行形态学膨胀操作,对膨胀操作之后的二值图像进行连通域检测,接下来对得到的框线轮廓内部进行填充操作,最后对框线增强之后的图像进行基于深度学习方法的图像去噪;对经过框线增强操作后的表格文档图像,分别定义两个结构元素作为形态学腐蚀和膨胀操作的内核矩阵参数,经过形态学腐蚀和膨胀操作之后把表格文档的横框线和竖框线分别检测并提取出来,然后采用基于NPcanny的直线检测算法对图像中的直线进行再次检测,将提取出来的横纵框线进行交叉,得到表格文档图像中完整的框线结构。
-
公开(公告)号:CN112200065B
公开(公告)日:2022-08-09
申请号:CN202011070118.3
申请日:2020-10-09
Applicant: 福州大学
Abstract: 本发明涉及一种基于动作放大和自适应注意力区域选取的微表情分类方法。首先获取微表情数据集,提取出起始帧和峰值帧;然后将提取的起始帧和峰值帧输入动作放大网络,生成动作放大后的图像;接着对放大后的图像进行预处理;最后利用自适应注意力区域选取方法对预处理后的图像进行识别,得到最终分类的结果。
-
公开(公告)号:CN110032989A
公开(公告)日:2019-07-19
申请号:CN201910327555.X
申请日:2019-04-23
Applicant: 福州大学
Abstract: 本发明涉及一种基于框线特征和像素分布的表格文档图像分类方法,首先对待分类图像进行灰度化和二值化,接着对得到的二值图像进行基于连通域分析的框线增强操作,对框线增强之后的图像进行基于深度学习方法的图像去噪;对经过预处理的待测图像,用基于形态学的直线检测方法分别检测并提取出横、纵框线,并将其细化,然后采用基于Npcanny的直线检测方法获取框线条数信息;对横框线图像进行水平方向投影,对纵框线进行垂直方向投影,并记录投影后的位置以及像素值,将得到的框线坐标与长度信息与模板库中已录入的标准模板信息进行匹配,筛选出与待分类图像相似度最高的模板图像,最后输出待分类图像的分类结果。本发明能够有效地对表格文档图像进行分类。
-
公开(公告)号:CN110033471B
公开(公告)日:2022-09-13
申请号:CN201910317129.8
申请日:2019-04-19
Applicant: 福州大学
Abstract: 本发明涉及一种基于连通域分析和形态学操作的框线检测方法。首先对读入的待检测表格文档图像进行灰度化,将得到的灰度图像二值化;然后对得到的二值图像进行形态学膨胀操作,对膨胀操作之后的二值图像进行连通域检测,接下来对得到的框线轮廓内部进行填充操作,最后对框线增强之后的图像进行基于深度学习方法的图像去噪;对经过框线增强操作后的表格文档图像,分别定义两个结构元素作为形态学腐蚀和膨胀操作的内核矩阵参数,经过形态学腐蚀和膨胀操作之后把表格文档的横框线和竖框线分别检测并提取出来,然后采用基于NPcanny的直线检测算法对图像中的直线进行再次检测,将提取出来的横纵框线进行交叉,得到表格文档图像中完整的框线结构。
-
-
-
-
-
-
-
-
-