提取文本特征的装置和方法

    公开(公告)号:CN106156196A

    公开(公告)日:2016-11-23

    申请号:CN201510193912.X

    申请日:2015-04-22

    Abstract: 本发明涉及提取文本特征的装置和方法。一种提取文本特征的装置,包括:分词单元,被配置为对输入文档进行分词得到多个词、每个词的词性和每个词与其相邻词的词性组合;重要性计算单元,被配置为计算每个词的重要程度;词性权重计算单元,被配置为计算每个词的词性的权重;词性组合权重计算单元,被配置为计算每个词与其相邻词的词性组合的权重;以及文本特征提取单元,被配置为对于每个词,根据其重要程度、词性的权重以及词性组合的权重来提取该词的文本特征。根据本发明的装置和方法,将词性和词性组合对文本特征的贡献融入特征提取方法中,对文本信息的提取更加充分,处理实时数据的速度更快。

    信息发布方法和系统
    72.
    发明公开

    公开(公告)号:CN106156116A

    公开(公告)日:2016-11-23

    申请号:CN201510160794.2

    申请日:2015-04-07

    Abstract: 本发明公开了一种信息发布方法和系统。根据本发明的一个方面,信息发布方法包括:对用户输入的检索词进行扩展;计算扩展的结果与多个行业类别中的每个行业类别的相关度得分;以及向用户发布与所述检索词具有最高相关度得分的行业类别相关联的信息。采用上述信息发布方法,根据用户输入的检索词,通过对其进行扩展,从而能够计算出该检索词与各个行业类别的相关程度。由此,可向用户发布与其检索的检索词最相关的行业类别的关联信息。这样的信息很有可能是用户所需要的信息,从而既方便了用户,又实现了信息的目的性发布。

    从彩色文档图像中提取特定区域的方法和设备

    公开(公告)号:CN106033528A

    公开(公告)日:2016-10-19

    申请号:CN201510101426.0

    申请日:2015-03-09

    Inventor: 刘威 范伟 孙俊

    Abstract: 本发明公开了从彩色文档图像中提取特定区域的方法和设备。根据本发明的从彩色文档图像中提取特定区域的方法包括:根据所述彩色文档图像,获得第一边缘图像;利用彩色通道的不均一性,获取二值化图像;合并所述第一边缘图像和所述二值化图像,以得到第二边缘图像;以及根据所述第二边缘图像,确定所述特定区域。根据本发明的方法和设备,能够以较高的精度和鲁棒性将彩色文档图像中的图片区域、半色调区域、被线框起来的封闭区域与普通文本区域分离。

    用于提取图像中对象边界的装置、方法以及电子设备

    公开(公告)号:CN103473543B

    公开(公告)日:2016-10-05

    申请号:CN201210187523.2

    申请日:2012-06-07

    CPC classification number: G06T7/0085 G06T7/12

    Abstract: 本发明提供了用于提取图像中对象边界的装置、方法以及电子设备,以至少克服现有的边界提取技术中存在的提取精度低或者需要多次手工调整的问题。上述装置包括:用于确定图像中对象的边界的起点和终点、以及确定与上述起点和终点相关的参考点的位置的位置确定单元;用于确定边界的第一方向的第一方向确定单元;用于获得第一区域的梯度图的梯度图获得单元;用于衰减梯度图中第二区域的梯度的梯度衰减单元;以及用于提取对象边界的提取单元。上述方法用于执行能够实现上述装置的功能的处理。上述电子设备包括上述装置。本发明的上述技术能够提高边界提取的精度,可以应用于图像处理领域。

    信息处理装置和信息处理方法

    公开(公告)号:CN103377199B

    公开(公告)日:2016-06-29

    申请号:CN201210112493.9

    申请日:2012-04-16

    Abstract: 提供一种信息处理装置和方法。信息处理方法包括:从图片中识别字符串作为备选;响应于得到备选字符串,根据其获取检索词;响应于检索词的获取,使用检索词来检索网页;响应于检索到的网页,对检索到的网页进行聚类;当作为聚类结果的网页类别与检索词的相关性大于等于第一预定程度但小于第二预定程度时,将该网页类别选择为第一网页类别;当网页类别与检索词的相关性大于等于第二预定程度时,将该网页类别选择为第二网页类别;响应于第一网页类别的选择,对照第一网页类别对检索词进行校验,并将校验后的检索词作为备选字符串以用于进一步获取检索词;以及基于与第二网页类别对应的检索词和预先建立的图片分类体系对图片内容主题类型进行识别。

    图像处理装置、图像处理方法以及设备

    公开(公告)号:CN103366165B

    公开(公告)日:2016-06-29

    申请号:CN201210091193.7

    申请日:2012-03-30

    Abstract: 本发明提供了图像处理装置、图像处理方法以及设备,以至少提高在针对文档所捕获的图像所进行的图像处理中的文档角点提取精度。图像处理装置包括:用于提取文档的沿第一方向的边界线和粗测文档角点的提取单元,其中,第一方向是文档图像的水平方向或垂直方向;用于在粗测文档角点附近、在沿第一方向的边界线上确定候选页角点的确定单元;以及用于在候选页角点中确定文档的文档角点的选择单元。图像处理方法用于执行能够实现上述图像处理装置的功能的处理。上述设备包括上述图像处理装置。应用本发明的上述技术,能够提取到较精确的文档角点,获得较好的图像处理效果,可以应用于图像处理领域。

    对扫描图像进行处理的方法和装置

    公开(公告)号:CN103377462B

    公开(公告)日:2016-05-04

    申请号:CN201210111235.9

    申请日:2012-04-16

    Inventor: 何源 孙俊 直井聪

    CPC classification number: G06T5/001 G06T5/005 G06T2207/10008 G06T2207/30176

    Abstract: 本发明涉及对扫描图像进行处理的方法和装置。对扫描图像进行处理的方法包括:被遮挡区域提取步骤,提取扫描图像的边缘附近的空白处被遮挡物遮挡的区域,即被遮挡区域;像素值修复步骤,根据贯穿被遮挡区域且与边缘平行的线段中的已知页边空白像素的像素值,通过线性模型来修复线段中的被遮挡区域像素的像素值;根据贯穿所述被遮挡区域且与边缘平行的线段中的已知页边空白像素的噪声来估计线段中的被遮挡区域像素的噪声;以及将估计出的噪声添加到通过线性模型修复的线段中的被遮挡区域像素的像素值。

    信息处理方法、信息处理装置和信息推荐方法

    公开(公告)号:CN105335371A

    公开(公告)日:2016-02-17

    申请号:CN201410259034.2

    申请日:2014-06-11

    Abstract: 公开了一种信息处理方法、信息处理装置和信息推荐方法,该信息处理方法包括:分词步骤,对预定数据库中的条形码数据指示的产品信息进行分词并将这些分词结果确定为关键词;关键词分类确定步骤,根据关键词在预定数据库中的统计信息而确定关键词对应的分类;以及关系建立步骤,建立条形码数据、关键词和关键词的分类之间的关系并且将该关系存储在预定数据库中。根据本公开的实施例,可以为用户提供基于条形码的扩展查询服务。

    图像处理装置和方法
    79.
    发明公开

    公开(公告)号:CN105096347A

    公开(公告)日:2015-11-25

    申请号:CN201410169177.4

    申请日:2014-04-24

    Inventor: 谢术富 何源 孙俊

    Abstract: 本公开涉及图像处理装置和方法。图像处理装置包括:获取单元,其获取包含对象图像的图像;计算单元,其基于图像的颜色和边缘特征计算候选对象图像区域;选择单元,其基于预定颜色模型,选择具有与预定颜色模型的最大相似度的候选对象图像区域作为第一对象图像区域,其中,最大相似度大于或等于相似度阈值;确定单元,其基于候选对象图像区域的颜色特征,使用第一对象图像区域将其它候选对象图像区域确定为非对象图像区域或第二对象图像区域;创建单元,其针对第一对象图像区域和第二对象图像区域中的每一个,分别创建自适应颜色模型;以及检测单元,其基于自适应颜色模型,在第一对象图像区域和第二对象图像中的每一个中检测包含对象图像的区域。

    信息处理方法以及信息处理装置

    公开(公告)号:CN105095206A

    公开(公告)日:2015-11-25

    申请号:CN201410157792.3

    申请日:2014-04-18

    Abstract: 本公开提供了信息处理方法以及信息处理装置。该信息处理方法包括:对富文本进行分割,根据分割得到的各个块产生与各个块分别对应的富文本组件;以及根据分割得到的块的预设特征的特征值获取对应的富文本组件的显示类型,以获取的显示类型显示对应的富文本组件。

Patent Agency Ranking