-
公开(公告)号:CN107918782A
公开(公告)日:2018-04-17
申请号:CN201711265210.3
申请日:2017-12-05
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种训练用于生成描述图像内容的自然语言的模型的方法,以及采用所述模型生成描述图像内容的自然语言的方法。其中,所述训练方法,包括:A1)将图像训练集中图像的全局特征以及局部特征作为注意力机制的输入,以获得同时包含全局特征以及局部特征的融合的结果;A2)将所述融合的结果和单词训练集作为长短记忆网络的输入,利用损失函数对所述注意力机制以及所述长短记忆网络进行训练,获得所述注意力机制的权值以及所述长短记忆网络的权值;其中,所述损失函数是已知图像的内容、以及描述所述图像内容的自然语句中前一个或多个单词时第i个单词的条件概率的函数,i=1,…imax。
-
公开(公告)号:CN107846592A
公开(公告)日:2018-03-27
申请号:CN201710969734.4
申请日:2017-10-18
Applicant: 中国科学院计算技术研究所
IPC: H04N19/132 , H04N19/172 , H04N19/19 , H04N19/42
CPC classification number: H04N19/132 , H04N19/172 , H04N19/19 , H04N19/42
Abstract: 本发明涉及一种压缩感知图像的采集重建方法,包括:采样步骤,通过对原始图像进行双光路调制并采样;重建步骤,采用图形处理器配合主控计算机调用压缩感知重建软件进行重建;或采样现场可编程门阵列,调用硬化在现场可编程门阵列内的压缩感知重建模块进行重建。本发明在现有压缩感知成像技术的基础上,设计了双光路采集方案,可以在不调整设备的情况下采集单帧静态图像或多帧连续图像,使用图形处理器对压缩感知重建算法软件进行加速,或采用硬化有压缩感知重建算法的现场可编程门阵列执行重建,达到了高效图像视频采集和快速重建的效果。
-
公开(公告)号:CN106372111A
公开(公告)日:2017-02-01
申请号:CN201610701965.2
申请日:2016-08-22
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种用于筛选局部特征点的方法,其包括基于原图像生成与其相似的多个相似图像;提取原图像和各个相似图像的局部特征点及其特征描述子;将原图像的局部特征点与各个相似图像中的局部特征点进行匹配,并将原图像中匹配成功的局部特征点的得分增加;选择原图像中得分高的前若干局部特征点作为最终保留的局部特征点。该方法通过分析所生成的相似图像与原图像之间的匹配结果,对不同的特征点进行了打分,量化了各个特征点在图像匹配中的贡献,以筛选出一系列高贡献的特征点,去除对图像检索匹配贡献较低的特征点,具有较好的鲁棒性,适合于大规模图像实时检索。
-
公开(公告)号:CN106372083A
公开(公告)日:2017-02-01
申请号:CN201510435105.4
申请日:2015-07-22
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明公开了一种有争议性新闻线索自动发现的方法及系统,该方法包括:步骤1,利用预设的初始文本对一文本集进行检索,获得多个检索文本;步骤2,对该多个检索文本进行聚类,对每一类的检索文本分别执行摘要提取算法,以获得该类的线索文本;步骤3,利用每类的该线索文本进行检索,获得每类的多个扩充文本;步骤4,利用每类的该多个扩充文本进行特征提取,基于一预设的打分模型对提取得到的每类的特征进行打分,分数高于一阈值的类所对应的线索文本为有争议的新闻线索。本发明可从大量文本中自动发现有争议新闻线索,实现了海量信息的深层信息挖掘,且可不断完善信息挖掘的准确度、有效性。
-
公开(公告)号:CN103514595B
公开(公告)日:2016-03-30
申请号:CN201210222279.9
申请日:2012-06-28
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种图像显著区域检测方法,包括:步骤1、边缘检测,得到边缘图像;步骤2、计算像素点视觉显著值和空间权重值;其中,每种颜色的视觉显著值由这种颜色在所述边缘图像里的像素点数目除以这种颜色在原始图像里的像素点数目得到,每个像素点的视觉显著值等于它颜色的视觉显著值;其中,每个像素点的空间权重值由它离核心点的距离决定,离核心点越近,其空间权重值越大,离核心点越远,其空间权重值越小;步骤3、综合视觉显著值和空间权重值得到像素点的最终显著值;和步骤4、基于最终显著值,利用均值飘移算法确定显著区域的像素点。该方法提高显著区域像素的检出数量,避免对背景颜色交界处的误检测。
-
公开(公告)号:CN104881669A
公开(公告)日:2015-09-02
申请号:CN201510243968.1
申请日:2015-05-13
Applicant: 中国科学院计算技术研究所
IPC: G06K9/46
CPC classification number: G06K9/4652
Abstract: 本发明公开了一种基于颜色对比度的局部区域检测子提取方法及系统,涉及图像检索、图像识别、对象跟踪检测领域,该方法包括获取图像,并对所述图像的四个角进行尺度选择,通过二维信息熵值的局部极小值选取所述图像的图像背景的最佳尺度,根据所述最佳尺度,建立背景RGB三通道高斯混合模型;对所述图像中每个像素点建立RGB三通道高斯混合模型,并根据每个所述像素点的RGB三通道高斯混合模型与所述背景RGB三通道高斯混合模型的KL距离,更新所述图像的颜色对比度排序;根据所述颜色对比度排序,通过分水岭的区域检测方式检测对比度一致的区域,所述区域为所述局部区域检测子。本发明提取检测子速度快,内存占用少。
-
公开(公告)号:CN104408092A
公开(公告)日:2015-03-11
申请号:CN201410645743.4
申请日:2014-11-14
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
CPC classification number: G06F17/30256
Abstract: 本发明提供一种基于排序测度特征的图像检索方法,该方法基于分块属性值相似度和位置相似度对待检测图像的排序测度特征进行置换以得到该图像的多个排序测度特征,从图像库中检索出其排序测度特征与待检测图像的任一排序测度特征相同的图像。该方法不需要计算排序测度特征之间的相似度,而是以定长字符串的比较方式匹配排序测度特征,提高了比对和检索的速度,适用于大规模图像检索。而且基于分块属性值相似度和位置相似度来对排序测度特征进行置换,这种置换考虑的属性值大小的分布,弥补了原OM特征仅考虑属性值高低而不考虑属性值差别大小的不足。
-
公开(公告)号:CN102609441A
公开(公告)日:2012-07-25
申请号:CN201110443604.X
申请日:2011-12-27
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供了基于分布熵的局部敏感哈希高维索引方法。该方法首先生成局部敏感哈希函数候选集合。接着,根据训练数据集,计算局部敏感哈希函数候选集合中每个哈希函数的分布熵值,并从中选取分布熵值最高的L个哈希函数作为局部敏感哈希函数集合。然后,基于该局部敏感哈希函数集合,将待索引数据集存储到哈希表中。还可以采用基于三角不等式过滤和欧氏距离排序的查询算法查询上述哈希表,得到与查询数据相似的结果集。该方法通过选择分布熵值高的哈希函数,更好地适应了数据的分布,从而优化了哈希表索引结构,减小了索引的内存消耗,同时使得查询更加准确和高效。
-
公开(公告)号:CN101819638B
公开(公告)日:2012-07-11
申请号:CN201010143777.5
申请日:2010-04-12
Applicant: 中国科学院计算技术研究所
IPC: G06K9/66
Abstract: 本发明提供一种色情检测模型建立方法,包括:从带有标注信息的样本音视频对象中提取视频特征和音频特征;根据所述标注信息,为所述样本音视频对象中的各类音频特征、视频特征分别训练模型,然后利用基于排序的加权平均融合方法计算所述模型间的融合参数;其中,所述的基于排序的加权平均融合方法遍历参数orness的取值区间,为所述参数orness的各个取值计算相应的融合参数,然后利用所述样本音视频对象计算各个融合参数的效果,选取效果最好的融合参数作为模型间的融合参数。本发明的色情检测方法与现有技术中的相关方法相比综合采用了视频特征与音频特征,检测准确率上有较大的提高。
-
公开(公告)号:CN102073676A
公开(公告)日:2011-05-25
申请号:CN201010568307.3
申请日:2010-11-30
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种网络色情视频实时检测方法和系统。所述方法包括下列步骤:根据网络视频的长度,建立关键帧预抽取帧号队列KFN={n1,n2,…,nN},其中n1<n2<…<nN;根据所述关键帧预抽取帧号队列,按顺序抽取一帧关键帧并解码;对解码后的关键帧进行色情内容检测,判断该关键帧是否包含色情内容;根据对单个关键帧色情内容的检测结果,连同之前得到的其他关键帧的检测结果,进行决策融合判定:如果判定“是”,则认为该视频包含色情内容,结束检测;如果判定“否”,则认为该视频不包含色情内容,结束检测;如果判定“不定”,则继续进行单个关键帧的检测。
-
-
-
-
-
-
-
-
-