一种文档处理系统和方法

    公开(公告)号:CN100578497C

    公开(公告)日:2010-01-06

    申请号:CN200610067065.3

    申请日:2006-03-31

    Abstract: 本发明公开了一种文档处理系统和方法,该系统包括:模板存储模块,用于存储输入模板和输出模板;模板匹配模块,用于接收输入文档,并通过输入文档的格式信息和/或输入模板的特定信息从模板存储模块选取相应的输入和/或输出模板;文档自动处理模块,用于根据模板匹配模块选择的输入模板提取输入文档的信息,并用于将提取出的输入文档的信息利用输出模板进行保存。本发明可以把指定的输入文档单元以指定的格式输出,很大地方便了文档处理的个性化需求;通过将输入文档每个单元的位置和属性记录在输入模板中,极大的提高了文档自动处理效率,同时也可以用来文档的分类。

    文档图像二值化方法
    2.
    发明授权

    公开(公告)号:CN100479484C

    公开(公告)日:2009-04-15

    申请号:CN200510107630.X

    申请日:2005-09-29

    Inventor: 郝瑛 欧文武 王刚

    Abstract: 本发明提供一种对文档图像进行二值化处理的图像处理方法,包含如下步骤:a)在全局阈值化处理中,确定用于图像进行二值化的全局阈值,根据所述全局阈值将所述文档图像的像素分为三类:黑,白和待定像素;b)为每个待定像素确定一个自适应的二值化阈值,根据所述自适应二值化阈值,将待定像素二值化。

    表格提取方法和设备
    3.
    发明授权

    公开(公告)号:CN100433045C

    公开(公告)日:2008-11-12

    申请号:CN200510113384.9

    申请日:2005-10-11

    Abstract: 提供了一种从电子文档图像中提取表格区域的表格提取方法。该方法包括以下步骤:(a)输入文档图像;(b)检测输入文档图像的背景差异,提取出带彩色或纹理背景的区域,作为备选表格区域;以及(c)考虑到通常表格中文字的分布情况,通过投影曲线分析方法鉴定备选表格区域,以确定表格区域。从而,可以提取出电子文档图像中不含直线而具有彩色或纹理背景的表格区域。

    确定文档阅读顺序的方法和设备

    公开(公告)号:CN101866418B

    公开(公告)日:2013-02-27

    申请号:CN200910134520.0

    申请日:2009-04-17

    Inventor: 欧文武 李滔

    Abstract: 本发明提供一种确定文档阅读顺序的方法,包括如下步骤:(a)基于预先定义的规则集合确定文档图像中文档块集合的阅读路径规范;(b)基于文档块集合的阅读路径规范确定候选的阅读顺序;(c)基于自适应的置信度评价方法来评价每个候选阅读顺序的置信度;(d)根据置信度来决定最终的文档阅读顺序。应用本发明,能够有效地确定文档阅读顺序以利于版面重构,以便将原本例如A4纸大小的较大文档中的文档块按阅读顺序进行排列,从而适合于在诸如手机或PDA的小屏幕设备上显示。

    表格提取方法和设备
    5.
    发明公开

    公开(公告)号:CN1949249A

    公开(公告)日:2007-04-18

    申请号:CN200510113384.9

    申请日:2005-10-11

    Abstract: 提供了一种从电子文档图像中提取表格区域的表格提取方法。该方法包括以下步骤:(a)输入文档图像;(b)检测输入文档图像的背景差异,提取出带彩色或纹理背景的区域,作为备选表格区域;以及(c)考虑到通常表格中文字的分布情况,通过投影曲线分析方法鉴定备选表格区域,以确定表格区域。从而,可以提取出电子文档图像中不含直线而具有彩色或纹理背景的表格区域。

    文档图像二值化方法
    6.
    发明公开

    公开(公告)号:CN1941838A

    公开(公告)日:2007-04-04

    申请号:CN200510107630.X

    申请日:2005-09-29

    Inventor: 郝瑛 欧文武 王刚

    Abstract: 本发明提供一种对文档图像进行二值化处理的图像处理方法,包含如下步骤:a)在全局阈值化处理中,确定用于图像进行二值化的全局阈值,根据所述全局阈值将所述文档图像的像素分为三类:黑,白和待定像素;b)为每个待定像素确定一个自适应的二值化阈值,根据所述自适应二值化阈值,将待定像素二值化。

    确定文档阅读顺序的方法和设备

    公开(公告)号:CN101866418A

    公开(公告)日:2010-10-20

    申请号:CN200910134520.0

    申请日:2009-04-17

    Inventor: 欧文武 李滔

    Abstract: 本发明提供一种确定文档阅读顺序的方法,包括如下步骤:(a)基于预先定义的规则集合确定文档图像中文档块集合的阅读路径规范;(b)基于文档块集合的阅读路径规范确定候选的阅读顺序;(c)基于自适应的置信度评价方法来评价每个候选阅读顺序的置信度;(d)根据置信度来决定最终的文档阅读顺序。应用本发明,能够有效地确定文档阅读顺序以利于版面重构,以便将原本例如A4纸大小的较大文档中的文档块按阅读顺序进行排列,从而适合于在诸如手机或PDA的小屏幕设备上显示。

    图像质量预测方法和设备以及故障诊断系统

    公开(公告)号:CN100474878C

    公开(公告)日:2009-04-01

    申请号:CN200510099176.8

    申请日:2005-09-09

    Abstract: 提供一种图像质量预测方法和设备以及故障诊断系统,所述图像质量预测方法包括:获取步骤,获取多个原始数据,训练步骤,通过所述多个原始数据来训练预测模型,以优化所述预测模型的系统参数;以及预测步骤,利用优化后的预测模型预测图像的质量。本发明的图像质量预测方法和设备以及故障诊断系统可以尽早发现诸如多功能一体机的设备和系统的故障。

    一种文档处理系统和方法

    公开(公告)号:CN101046808A

    公开(公告)日:2007-10-03

    申请号:CN200610067065.3

    申请日:2006-03-31

    Abstract: 本发明公开了一种文档处理系统和方法,该系统包括:模板存储模块,用于存储输入模板和输出模板;模板匹配模块,用于接收输入文档,并通过输入文档的格式信息和/或输入模板的特定信息从模板存储模块选取相应的输入和/或输出模板;文档自动处理模块,用于根据模板匹配模块选择的输入模板提取输入文档的信息,并用于将提取出的输入文档的信息利用输出模板进行保存。本发明可以把指定的输入文档单元以指定的格式输出,很大地方便了文档处理的个性化需求;通过将输入文档每个单元的位置和属性记录在输入模板中,极大的提高了文档自动处理效率,同时也可以用来文档的分类。

    图像质量预测方法和设备以及故障诊断系统

    公开(公告)号:CN1929530A

    公开(公告)日:2007-03-14

    申请号:CN200510099176.8

    申请日:2005-09-09

    Abstract: 提供一种图像质量预测方法和设备以及故障诊断系统,所述图像质量预测方法包括:获取步骤,获取多个原始数据,训练步骤,通过所述多个原始数据来训练预测模型,以优化所述预测模型的系统参数;以及预测步骤,利用优化后的预测模型预测图像的质量。本发明的图像质量预测方法和设备以及故障诊断系统可以尽早发现诸如多功能一体机的设备和系统的故障。

Patent Agency Ranking