一种基于QPSO黎曼流形学习的视频相似度度量方法

    公开(公告)号:CN108256478A

    公开(公告)日:2018-07-06

    申请号:CN201810045439.4

    申请日:2018-01-17

    Applicant: 吉林大学

    Abstract: 本发明提出一种基于QPSO黎曼流形学习的视频相似度度量方法。该算法将视频相似度视为图像集相似度度量问题,图像对齐后提取纹理特征并进行融合处理,再利用带有QPSO优化的黎曼流形大幅度简约维度以获得视频数据的内在表示,相似度的度量则采用仿射包距离标定方法,最后利用libSVM获得最佳分类识别结果。通过在相关视频数据库上进行的对比实验,验证了所提算法的有效性,所提算法识别精度较高,误差较低,并且具有较强的鲁棒性。

    基于局部平面线性点的翻拍图像鉴别方法

    公开(公告)号:CN104867149B

    公开(公告)日:2017-07-21

    申请号:CN201510263628.5

    申请日:2015-05-16

    Applicant: 吉林大学

    Abstract: 本发明提出一种基于局部平面线性点的翻拍图像鉴别方法,该方法包括以下几个步骤:首先将彩色图像转化成灰度图像,其次计算图像的一阶偏导数和二阶偏导数;提取出局部平面线性点,并计算特征值;然后对特征值进行平移运算,避免产生间断点,同时对特征值进行取对数处理,限制特征向量的取值范围,得到用来分类的特征向量。最后通过分类器对真实图像和翻拍图像进行分类。本发明有效提高了不同介质所得到翻拍图像的鉴别率,并通过实验数据验证了本算法的有效性。

    一种针对噪声关联的文本-图像行人重识别方法

    公开(公告)号:CN119649411A

    公开(公告)日:2025-03-18

    申请号:CN202510153220.6

    申请日:2025-02-12

    Applicant: 吉林大学

    Abstract: 本发明公开了一种针对噪声关联的文本‑图像行人重识别方法。该方法包括:分别对图像与文本进行全局特征表示以及局部特征表示,并进行全局特征标记与局部特征标记;采用动态特定于实例的选择与校正方法,对图像与文本数据进行划分;构建多粒度全局特征学习模块,将图像与文本的局部特征输入多粒度全局特征学习模块,得到多粒度的全局特征;通过ID分类损失与相似度分布匹配损失训练优化网络模型,对身份ID进行损失的计算,对多粒度全局特征完成相似度分布匹配损失的计算。通过本发明的技术方案,有效提高基于文本描述的行人重识别的匹配精度。

    基于多示例学习的视频人脸识别方法

    公开(公告)号:CN104778457B

    公开(公告)日:2017-12-01

    申请号:CN201510183977.6

    申请日:2015-04-18

    Applicant: 吉林大学

    Abstract: 本发明提出一种基于多示例学习的视频人脸识别算法,该算法将每个人脸视频视为一个包,将视频中正规化后的人脸帧图像作为包中的示例,采用基于加权的分块局部二值模式级联直方图作为示例特征,在训练集合的多示例特征空间中,采用多示例学习算法得到分类器,进而实现对测试样本的分类及预测。通过在人脸视频库中的相关实验,该算法得到了比较高的识别精度,同时,该方法对光照变化、表情变化等具有良好的鲁棒性,验证了算法的有效性。

    一种从RGB图像重构高光谱方法及系统

    公开(公告)号:CN119600459A

    公开(公告)日:2025-03-11

    申请号:CN202510147622.5

    申请日:2025-02-11

    Applicant: 吉林大学

    Abstract: 本发明提供一种从RGB图像重构高光谱方法及系统,所述方法包括:获取三通道RGB图像;利用卷积神经网络对RGB图像进行嵌入和通道扩充,获得初始特征图;将初始特征图输入编码器,利用其中的VisionTransformer和VisionMamba分别提取通道维度特征和空间维度特征并融合,分别输入跳跃连接与可分离卷积,获得不同层级的特征图;将其输入至解码器获得最终特征图;利用卷积神经网络对最终特征图进行映射,并与输入编码器之前的初始特征图相加,得到压缩形式的高光谱图像;对压缩形式的高光谱图像按通道数进行拆分,然后进行色彩映射,最终得到重构高光谱图像。本发明能够提高从RGB图像重构高光谱的精度和泛化性能。

    基于Bi-LSTM与TF-IDF的新冠疫情预测与分析方法

    公开(公告)号:CN112582074A

    公开(公告)日:2021-03-30

    申请号:CN202011236359.0

    申请日:2020-11-02

    Applicant: 吉林大学

    Inventor: 刘晓夏 吕颖达

    Abstract: 本发明提供一种基于Bi‑LSTM与TF‑IDF的新冠疫情预测与分析方法,具体为:根据目标区域的类别收集病患信息;P2,利用Bi‑LSTM模型对病患的关键信息进行识别和提取;P3,利用TF‑IDF模型计算得到已抽取信息的权重系数;P4,利用多分类SVM对信息进行分类;P5,筛选信息形成患者路径地图/疫情传播关系树并预测疫情始发地/零号病人。本发明综合利用人工智能和自然语言处理技术,针对区域的不同情况采取相应的处理策略,动态建立预测模型,通过应用机器学习中的分类模型以及实际情况,对信息对应的权重系数进行了多次调整,使得预测过程更符合客观科学规律和疫情实际情况,从而能够分析出目标区域的疫情源头信息,在遏制疫情蔓延的同时,从源头上避免疫情的肆虐乃至复发。

    基于ROCGraph的图像分割质量评价方法

    公开(公告)号:CN104794714A

    公开(公告)日:2015-07-22

    申请号:CN201510183962.X

    申请日:2015-04-18

    Applicant: 吉林大学

    CPC classification number: G06T2207/20

    Abstract: 本发明提出了一种基于ROC Graph的图像分割质量评价方法,该方法包括以下几个步骤:第一,通过与参考分割图像作对比,将待评价分割图像中的像素分为四类,第二,引入像素空间信息,对参考图像中的像素进行距离变换,计算每个像素到目标边界的距离;第三,根据参考图像中每个像素的距离系数,赋予分割图像中相应位置的像素一个权值;第四,利用权值计算出加权真正率wTPR和加权假正率wFPR,并在ROCGraph中描出点(wFPR,wTPR);第五,根据ROC Graph中(wFPR,wTPR)点到(0,1)点的距离,为分割图像打分,分数越高,表明待评价图像的分割效果越好。本发明所述方法能够有效地对分割图像的质量好坏做出评价,而且评价结果更为合理、直观,与人类视觉的主观评价结果一致。

    一种基于大模型和预训练的假新闻检测推断方法及系统

    公开(公告)号:CN119851078A

    公开(公告)日:2025-04-18

    申请号:CN202510314705.9

    申请日:2025-03-18

    Applicant: 吉林大学

    Abstract: 本发明公开一种基于大模型和预训练的假新闻检测推断方法及系统,涉及图像处理和大型视觉语言模型领域。本发明利用Vision Transformer对图像和音频信息编码,Transformer对文本信息进行编码,通过对比学习技术实现多模态语义对齐,通过训练得到所需的编码器,将该编码器提取到的文本特征与图像特征使用多模态交叉注意力模块进行特征融合,获得文本图像融合特征;然后将文本图像融合特征、人脸图像特征与音频特征使用多模态特征增强模块处理,获得增强特征,捕捉新闻中的细微差别和潜在的操纵迹象;最后使用已有的大型视觉‑语言模型作为骨干网络,将增强特征传入到模型中,最终得到更加精准的判断结果以及推理结果。

Patent Agency Ranking