-
公开(公告)号:CN107305682A
公开(公告)日:2017-10-31
申请号:CN201610258517.X
申请日:2016-04-22
Applicant: 富士通株式会社
IPC: G06T3/00
Abstract: 本发明涉及一种对图像进行拼接的方法和装置。该方法包括:基于第一重叠图像中的像素的梯度信息确定其中的稠密区域;将稠密区域划分为多个块,并在第二重叠图像中确定与多个块分别对应的对应块;基于每个块中的每个像素的梯度值来确定候选样本块;针对每一个候选样本块,找到该候选样本块和第二重叠图像中的与其对应的对应块中的匹配特征点对;基于匹配特征点对之间的连线的倾斜角度来确定该候选样本块的所有匹配特征点中的稳定匹配特征点对;基于每个候选样本块中匹配特征点对的数目和倾斜角度来计算稳定匹配特征点对的置信度;选取预定比例置信度高的匹配特征点对来校正其余置信度低的匹配特征点对;以及基于所获得的匹配特征点对进行图像拼接。
-
公开(公告)号:CN106469432A
公开(公告)日:2017-03-01
申请号:CN201510497910.X
申请日:2015-08-13
Applicant: 富士通株式会社
CPC classification number: G06T3/0012 , G06T2207/10004 , G06T2207/10024
Abstract: 公开了一种对象提取方法和对象提取设备。该对象提取方法包括:计算背景图像中像素的梯度和梯度方向,将梯度与第一阈值比较,提取背景图像的二值化边缘图;计算包括前景对象的当前帧中像素的梯度和梯度方向,将梯度与第二阈值比较,提取当前帧的二值化边缘图;基于背景图像和当前帧的二值化边缘图、以及背景图像和当前帧中的像素的梯度方向,提取前景对象的二值化边缘图;将前景对象的二值化边缘图中的包括前景对象的区域划分成具有预定大小的单元,找到前景对象的边界单元;以及将边界单元分割为前景边界部分和背景部分,得到前景对象的边界,从而得到前景对象的掩膜。根据本公开的实施例,能够实现无需任何用户交互的自动对象提取。
-
公开(公告)号:CN106296745A
公开(公告)日:2017-01-04
申请号:CN201510276320.4
申请日:2015-05-26
Applicant: 富士通株式会社
CPC classification number: G06T3/0037 , G06T2207/30176
Abstract: 本发明涉及对文档图像进行校正的方法和装置。该方法包括:输入文档图像及其对应的三维空间上的三维数据点;利用文档图像提取文档图像中的文档页面的边界并估计边界上的三维数据点;对三维空间上的三维数据点进行采样并基于采样的三维数据点构建三维网格;基于三维网格来估计二维网格;以及利用所估计的二维网格对文档图像进行校正。根据本发明的方法和装置,能够重构和展平扭曲的文档图像。
-
公开(公告)号:CN106295484A
公开(公告)日:2017-01-04
申请号:CN201510325050.1
申请日:2015-06-12
Applicant: 富士通株式会社
IPC: G06K9/00
Abstract: 本发明提供了一种提取文档边界的方法和装置。根据一个实施例的提取文档边界的方法包括:获取基准平面的深度;获取放置在基准平面上的文档的文档图像;获取文档图像的三维点的深度;基于基准平面的深度以及文档图像的三维点的深度在文档图像中提取文档的边界。根据本发明实施例的提取文档边界的方法和装置,可以利用基准平面和文档图像中的三维点的深度在文档图像中提取文档的边界,从而可以降低文档的内容对边界提取的影响。
-
公开(公告)号:CN105701767A
公开(公告)日:2016-06-22
申请号:CN201410709262.5
申请日:2014-11-28
Applicant: 富士通株式会社
Abstract: 本发明涉及一种全景图像构建装置和方法。该全景图像构建装置包括:搜索模块,被配置成在网络上搜索与表示场景信息的关键字相关的图像;提取模块,被配置成提取所述图像的特征;生成模块,被配置成通过根据所述特征将所述图像进行聚类,生成图像簇;及拼接模块,被配置成将所述图像簇进行拼接,以构建全景图像。通过本发明,用于构建全景图像的相关图像的获得将不用人工完成,全景图像的构建不再依赖GPS信息,用户能够构建任意时刻的全景图像,并且全景图像的构建不再局限于地点、风景信息,而是延伸至任意动态场景。
-
公开(公告)号:CN105488515A
公开(公告)日:2016-04-13
申请号:CN201410474927.9
申请日:2014-09-17
Applicant: 富士通株式会社
Abstract: 本发明提供一种训练卷积神经网路分类器的方法和图像处理装置。根据该训练卷积神经网络分类器的方法,从训练用图像中提取全局特征和局部特征。根据预定模式将全局特征和局部特征映射到特征图以作为分类器的输入样本。根据预定模式,全局特征被映射到至少一个第一区域,局部特征被映射到一个第二区域,每个第一区域与第二区域相接。根据本公开的训练方法,较大程度上提高了检测的速度和准确度。
-
公开(公告)号:CN105184312A
公开(公告)日:2015-12-23
申请号:CN201510522970.2
申请日:2015-08-24
Applicant: 中国科学院自动化研究所 , 富士通株式会社
CPC classification number: G06K9/6256 , G06K9/627 , G06N3/088
Abstract: 本发明公开了一种基于深度学习的文字检测方法及装置。所述方法包括:设计多层卷积神经网络结构,把每一个字符作为一个类别,这样就形成了一个多类别分类问题;采用反向传播算法训练卷积神经网络用以识别单一字符,有监督地最小化该网络的目标函数,得到字符识别模型;最后用前端的特征提取层进行权值初始化,把最后一个全连接层结点数目改为2,使得网络成为一个二分类模型,用文字和非文字样本训练网络。经过以上步骤,一个文字检测分类器就完成了。在测试的时候,把全连接层转化为卷积层,给定一张输入图像,需要先进行多尺度滑动窗口扫描获得文字的概率图,再进行非极大值抑制得到最终的文字区域。
-
公开(公告)号:CN104794701A
公开(公告)日:2015-07-22
申请号:CN201410027780.9
申请日:2014-01-21
Applicant: 富士通株式会社
Abstract: 本发明实施例提供一种图像拼接装置、方法以及图像处理设备。所述图像拼接方法包括:对第一图像和第二图像进行初始配准,在第一图像的空白区域中获得第一拼接缝;利用第一拼接缝在第二图像的相应区域中进行特征点的匹配,根据匹配的结果在第二图像上获得第二拼接缝;计算第一拼接缝和第二拼接缝之间的距离容差,根据该距离容差来修正第一拼接缝或第二拼接缝;基于第一拼接缝和第二拼接缝进行图像拼接,并对拼接后的原始图像进行补偿以获得拼接后的最终图像。通过本发明实施例,可以进一步提高图像拼接的准确性,获得拼接效果更好的图像。
-
公开(公告)号:CN103376890A
公开(公告)日:2013-10-30
申请号:CN201210121832.X
申请日:2012-04-16
Applicant: 富士通株式会社
Abstract: 本发明公开了一种基于视觉的手势遥控系统,该基于视觉的手势遥控系统包括:图像捕获设备,用于捕获对象的一系列图像;手势识别设备,用于从图像捕获设备所捕获的一系列图像识别对象的手势并将识别结果发送给操作命令触发设备;以及操作命令触发设备,用于根据从手势识别设备发送来的识别结果来触发预定操作命令。所述手势识别设备包括:手检测部件,用于从图像捕获设备所捕获的图像检测对象的手;手跟踪部件,用于在当手检测部件在一图像中检测到对象的手时,在接下来的图像中跟踪对象的手;手势识别部件,用于根据手检测部件检测到的对象的手和手跟踪部件跟踪到的对象的手来确定对象的手的运动并根据所确定的对象的手的运动来识别对象的手势。
-
-
-
-
-
-
-
-
-