提取网页内容的方法和装置

    公开(公告)号:CN101515272B

    公开(公告)日:2012-10-24

    申请号:CN200810080786.7

    申请日:2008-02-18

    Inventor: 杜成

    Abstract: 本发明提供一种用于提取网页内容的方法和装置。所述方法包括:基于数字文档分析(DDA)方法提取输入网页的网页内容,产生DDA提取结果;基于文档图像识别(DIR)方法提取输入网页的网页内容,产生DIR提取结果;融合所述DDA提取结果和DIR提取结果,产生融合结果。根据本发明,能够得到比传统技术更优的网页提取结果。

    从可移植电子文档中提取表格的方法和装置

    公开(公告)号:CN101833546A

    公开(公告)日:2010-09-15

    申请号:CN200910126664.1

    申请日:2009-03-10

    Abstract: 提出了一种从可移植电子文档中提取表格的装置和方法。所述提取表格的装置包括:命令获取单元,用于解析可移植电子文档的内容以获取和表格相关的命令;线条提取单元,用于通过处理这些命令来提取线条和线条位置;表格提取单元,用于分析线条的位置关系来提取表格。利用本发明的装置和方法,可以自动地从可移植电子文档中提取表格。

    一种文档处理系统和方法

    公开(公告)号:CN100578497C

    公开(公告)日:2010-01-06

    申请号:CN200610067065.3

    申请日:2006-03-31

    Abstract: 本发明公开了一种文档处理系统和方法,该系统包括:模板存储模块,用于存储输入模板和输出模板;模板匹配模块,用于接收输入文档,并通过输入文档的格式信息和/或输入模板的特定信息从模板存储模块选取相应的输入和/或输出模板;文档自动处理模块,用于根据模板匹配模块选择的输入模板提取输入文档的信息,并用于将提取出的输入文档的信息利用输出模板进行保存。本发明可以把指定的输入文档单元以指定的格式输出,很大地方便了文档处理的个性化需求;通过将输入文档每个单元的位置和属性记录在输入模板中,极大的提高了文档自动处理效率,同时也可以用来文档的分类。

    能识别多角度目标的图像检测装置

    公开(公告)号:CN101271515A

    公开(公告)日:2008-09-24

    申请号:CN200710087885.3

    申请日:2007-03-21

    CPC classification number: G06K9/3208 G06K9/00228 G06K9/4614

    Abstract: 本发明提供一种能识别多角度目标的图像检测装置及方法,所述图像检测装置包括:角度辨识器,用于判断输入图像的角度;检测装置,其根据角度辨识器所判断出的图像角度在输入图像中检测目标图像。本发明还提供一种角度辨识器以及一种识别多角度目标的方法。本发明通过一个角度辨识器确定目标图像的角度,然后再用同一个目标分类器进行识别。在候选角度有限且已知的情况下,可以通过结构很简单的分类器区别出不同角度的人脸,因此拥有比传统技术更好的效率。并且,本发明只需要存储一个目标分类器结构,在检测时通过调整一个参考目标分类器的参数来实现多角度方向的人脸检测,节省了装置的存储空间。

    一种快速目标检测和目标输出的图像检测方法及装置

    公开(公告)号:CN101271514A

    公开(公告)日:2008-09-24

    申请号:CN200710087879.8

    申请日:2007-03-21

    Abstract: 本发明提供了一种能够快速检测并输出图像中的目标区域的图像检测方法和装置。所述图像检测方法首先基于输入图像信号建立图像金字塔序列,然后基于所述图像金字塔序列的每层图像来获得多个图像块,并检测其中是否存在目标区域,如果存在目标区域,则立即输出并显示所检测到的目标区域。而且,在进行目标区域检测之前,通过预先去除与上一层图像中的目标区域发生重合的图像块,可以减少检测运算量,提高检测速度,从而便利于用户更快地得到检测结果。

    能识别多角度目标的图像检测装置

    公开(公告)号:CN101271515B

    公开(公告)日:2014-03-19

    申请号:CN200710087885.3

    申请日:2007-03-21

    CPC classification number: G06K9/3208 G06K9/00228 G06K9/4614

    Abstract: 本发明提供一种能识别多角度目标的图像检测装置及方法,所述图像检测装置包括:角度辨识器,用于判断输入图像的角度;检测装置,其根据角度辨识器所判断出的图像角度在输入图像中检测目标图像。本发明还提供一种角度辨识器以及一种识别多角度目标的方法。本发明通过一个角度辨识器确定目标图像的角度,然后再用同一个目标分类器进行识别。在候选角度有限且已知的情况下,可以通过结构很简单的分类器区别出不同角度的人脸,因此拥有比传统技术更好的效率。并且,本发明只需要存储一个目标分类器结构,在检测时通过调整一个参考目标分类器的参数来实现多角度方向的人脸检测,节省了装置的存储空间。

    从可移植电子文档中提取字符外接矩形的设备和方法

    公开(公告)号:CN102081594B

    公开(公告)日:2014-02-05

    申请号:CN200910249849.1

    申请日:2009-11-27

    CPC classification number: G06F17/214 G06K9/342 G06K2209/01

    Abstract: 本发明提供一种从可移植电子文档中提取字符外接矩形的设备和方法。该设备包括:命令及资源提取装置,针对可移植电子文档的页,提取与页中的文本段相应的文本段相关命令和字体资源;划分装置,将字体资源划分为无需替换的字体和需要替换的字体,需要替换的字体作为待替换字体;字体替换装置,在外部替换字体列表中寻找与待替换字体在字形度量上最相似的字体作为替补字体,以替换待替换字体,替补字体和无需替换的字体组成替换后字体的字体资源;度量信息提取装置,根据替换后字体的字体资源来提取文本段的字符的字形度量信息;计算装置,根据文本段相关命令和字符的字形度量信息,来计算字符的外接矩形。

    图像增强方法和装置、物体检测方法和装置

    公开(公告)号:CN102236883A

    公开(公告)日:2011-11-09

    申请号:CN201010156837.7

    申请日:2010-04-27

    Inventor: 杜成

    CPC classification number: G06T5/008 G06K9/00228 G06T2207/30201

    Abstract: 提供了图像增强方法、物体检测方法及对应装置。增强图像的方法可以包括:a)以该图像为待增强图像,检测该图像中的特定物体;b)基于包含所检测出的特定物体的区域的图像特征,确定图像增强参数,使得基于该图像增强参数增强的图像将突出该区域的图像特征;c)根据所确定的图像增强参数来增强该待增强图像;d)检测增强后图像中的特定物体;e)判断预定停止条件是否满足,如果满足预定停止条件,则输出目前为止物体检测结果最好的增强后的图像;否则,以增强后的图像为待增强图像,重复步骤b)到e)。通过基于包括所检测物体的区域的特征确定图像增强参数,以及通过迭代增强图像,可逐步得到好的物体检测结果。

Patent Agency Ranking