一种智能图像识别和描述方法

    公开(公告)号:CN109145946B

    公开(公告)日:2022-02-11

    申请号:CN201810776374.0

    申请日:2018-07-09

    Applicant: 暨南大学

    Inventor: 孔锐 谢玮

    Abstract: 本发明公开了一种智能图像识别和描述方法,包括步骤:1)用卷积神经网络来提取输入图像的特征,生成固定长度的特征向量;2)用提取出的特征向量初始化循环神经网络语言模型LSTM,从而生成句子,描述该输入图像。本方法是一种端到端的图像描述神经网络模型,结合了当前领先的视觉模型Inception V4和语言模型LSTM,与先前的基线模型相比,本专利模型具有特征提取能力强,生成句子描述详细等优点,性能有了显著提高,非常具有实用价值。

    一种智能图像识别和描述方法

    公开(公告)号:CN109145946A

    公开(公告)日:2019-01-04

    申请号:CN201810776374.0

    申请日:2018-07-09

    Applicant: 暨南大学

    Inventor: 孔锐 谢玮

    CPC classification number: G06K9/6256 G06K9/6232

    Abstract: 本发明公开了一种智能图像识别和描述方法,包括步骤:1)用卷积神经网络来提取输入图像的特征,生成固定长度的特征向量;2)用提取出的特征向量初始化循环神经网络语言模型LSTM,从而生成句子,描述该输入图像。本方法是一种端到端的图像描述神经网络模型,结合了当前领先的视觉模型Inception V4和语言模型LSTM,与先前的基线模型相比,本专利模型具有特征提取能力强,生成句子描述详细等优点,性能有了显著提高,非常具有实用价值。

Patent Agency Ranking