-
公开(公告)号:CN109145946B
公开(公告)日:2022-02-11
申请号:CN201810776374.0
申请日:2018-07-09
Applicant: 暨南大学
IPC: G06V10/82 , G06V10/774 , G06V10/77 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种智能图像识别和描述方法,包括步骤:1)用卷积神经网络来提取输入图像的特征,生成固定长度的特征向量;2)用提取出的特征向量初始化循环神经网络语言模型LSTM,从而生成句子,描述该输入图像。本方法是一种端到端的图像描述神经网络模型,结合了当前领先的视觉模型Inception V4和语言模型LSTM,与先前的基线模型相比,本专利模型具有特征提取能力强,生成句子描述详细等优点,性能有了显著提高,非常具有实用价值。
-
公开(公告)号:CN109145946A
公开(公告)日:2019-01-04
申请号:CN201810776374.0
申请日:2018-07-09
Applicant: 暨南大学
IPC: G06K9/62
CPC classification number: G06K9/6256 , G06K9/6232
Abstract: 本发明公开了一种智能图像识别和描述方法,包括步骤:1)用卷积神经网络来提取输入图像的特征,生成固定长度的特征向量;2)用提取出的特征向量初始化循环神经网络语言模型LSTM,从而生成句子,描述该输入图像。本方法是一种端到端的图像描述神经网络模型,结合了当前领先的视觉模型Inception V4和语言模型LSTM,与先前的基线模型相比,本专利模型具有特征提取能力强,生成句子描述详细等优点,性能有了显著提高,非常具有实用价值。
-