基于变量重要性评分和奈曼皮尔逊检验的宏基因组特征选择方法

    公开(公告)号:CN110189799A

    公开(公告)日:2019-08-30

    申请号:CN201910417875.4

    申请日:2019-05-20

    Abstract: 本发明公开了一种基于变量重要性评分和奈曼皮尔逊检验的宏基因组特征选择方法,1、对于一个输入的宏基因组分类可操作单元数据集,使用对称不确定性计算每个微生物特征与样本表现型的相关性,依据相关性得分筛选特征,生成子数据集;2、以有放回抽样方式对子数据集进行采样,然后使用变量重要性评分选择前k个特征,迭代上述步骤,迭代完成后统计每个特征的出现次数;3、使用奈曼皮尔逊检验方法计算给定参数下的阈值,筛选出现次数大于阈值的特征作为候选特征集合,出现次数最多的前k个特征为目标特征子集;本发明所提取的宏基因特征显著提高了分类效果,具有更高的稳定性,生成的候选特征集合方便了宏基因组后续医学实验的开展。

    基于投影法的两阶段文档图像非线性失真校正方法

    公开(公告)号:CN109063704A

    公开(公告)日:2018-12-21

    申请号:CN201810730869.X

    申请日:2018-07-05

    CPC classification number: G06K9/3283 G06K9/344 G06K2209/01

    Abstract: 本发明公开一种基于投影法的两阶段文档图像非线性失真校正方法,1、对于取得的文档图像进行二值化预处理,使用边界检测和提取算法自适应地检测和提取有效区域边界,获得文档图像校正区域;2、对于经过预处理的文档图像,首先基于投影法提取文本行基线,然后选取基准点,构建扭曲表面变换模型进行第一阶段的校正,称为粗校正;3、在粗校正进行之后,对图像再次用投影法提取文本行基线,然后根据提取的文本行基线,以文本行为单位,对文本行中的连通区域进行更加细致的第二阶段校正,称为细校正。本发明能够克服了文档图像中透视、倾斜、扭曲变形等一系列非线性失真对于文档图像OCR识别的影响,提高了OCR识别的准确率。

    一种基于直线连续性的文档图像来源判别方法

    公开(公告)号:CN104166843B

    公开(公告)日:2017-02-15

    申请号:CN201410389826.1

    申请日:2014-08-08

    Abstract: 一种基于直线连续性的文档图像来源判别方法,首先对输入的二值图像进行边缘提取的操作,然后使用3*N的直线检测模板进行水平和竖直方向的直线段检测,并通过搜索得到完整的直线段以及直线段两端局部区域内的孤立噪声点;随后在检测到的直线段上进行双向的扩展搜索得到直线段对应的基底直线长度;最后根据基底直线的长度进行分类,并计算每一类中直线段长度和基底直线长度的比值作为特征,将孤立噪声点的数目和直线段数目的比值作为附加的特征添加后输入训练过的SVM分类器中进行分类,最终输出图像的类别;本发明针对了二值文档图像来源判别方法中的不足和空白,在保证没有误判的基础上,可以快速地区分大多数含有直线的文档图像。

    基于深度信息的指尖检测方法

    公开(公告)号:CN103488972B

    公开(公告)日:2016-07-06

    申请号:CN201310407231.X

    申请日:2013-09-09

    Abstract: 基于深度信息的指尖检测方法,指尖是指从手心出发经过指根点的测地路径的终点,检测方法包括如下步骤:1、手部分割及手心定位;2、指根定位:包括初始阶段的指根检测和手掌平面旋转时的指根位置估计;3、指尖检测:包括图模型建立、手指定位和指尖定位;本发明检测方法无论对于静止的手势还是运动的手势都能达到较高的识别率,且能够做到实时检测;同时,当手掌与镜头成一定角度时,也能达到较高的检测精度;通过计算指尖位置达到手势识别的目的,实现了稳定准确的指尖位置检测,并且可通过计算手掌法向量实现多角度指尖检测。

    基于局部对称关系的烟梗提取方法

    公开(公告)号:CN105654088A

    公开(公告)日:2016-06-08

    申请号:CN201610128336.5

    申请日:2016-03-07

    CPC classification number: G06K9/6219 G06K9/40 G06K9/42 G06K9/6215 G06K2209/19

    Abstract: 本发明公开了一种基于局部对称关系的烟梗提取方法,该方法主要包括两步,第一步使用基于局部对称性变换方法获得对称性特征图和笔画宽度特征图,接着将对称性特征图和笔画宽度特征图与原图组合成一个五通道的特征空间,然后在这个特征空间上使用区域生长算法获得烟梗连通区域;第二步使用层次聚类方法将可能属于一个烟梗的多个断裂的连通区域连接起来,最后使用了一个基于阈值的连通区域过滤方法获得最后的主要烟梗;烟梗提取出来之后可以利用烟梗的位置来进行烟叶的分选或者对烟叶进行梗茎剔除操作以确保香烟质。

    基于深度信息的指尖检测方法

    公开(公告)号:CN103488972A

    公开(公告)日:2014-01-01

    申请号:CN201310407231.X

    申请日:2013-09-09

    Abstract: 基于深度信息的指尖检测方法,指尖是指从手心出发经过指根点的测地路径的终点,检测方法包括如下步骤:1、手部分割及手心定位;2、指根定位:包括初始阶段的指根检测和手掌平面旋转时的指根位置估计;3、指尖检测:包括图模型建立、手指定位和指尖定位;本发明检测方法无论对于静止的手势还是运动的手势都能达到较高的识别率,且能够做到实时检测;同时,当手掌与镜头成一定角度时,也能达到较高的检测精度;通过计算指尖位置达到手势识别的目的,实现了稳定准确的指尖位置检测,并且可通过计算手掌法向量实现多角度指尖检测。

    一种文字图像特征差异的快速计算方法

    公开(公告)号:CN103440472A

    公开(公告)日:2013-12-11

    申请号:CN201310331596.9

    申请日:2013-08-01

    Abstract: 本发明公开了一种文字图像特征差异的快速计算方法,首先基于几何形状特征的多样性,采用前景像素个数、文字大小、长宽比和占空比四个特征对差异较大的文字对进行初步筛选,这样从整体上对各种文字进行有效描述,同时减少图像失真带来的负面影响;在初步筛选之后,对剩下的配对进行精细特征描述,并采用修正的模板匹配方法,该方法通过在图像中滑动给定模板获取与模板相匹配的目标。经过粗特征筛选进入到精细模板匹配的文字块,彼此的大小差异受到粗特征中文字大小的制约,从而大大降低了匹配过程中的比较次数。进一步,提出了一种查找表联合位存储的加速方法,该方法根据相似性度量特点,通过预先建立文字块与数据的对应关系实现了性能提升。

    基于局部信息的文档图像校正方法

    公开(公告)号:CN103413271A

    公开(公告)日:2013-11-27

    申请号:CN201310303996.9

    申请日:2013-07-18

    Abstract: 基于局部信息的文档图像校正方法,首先通过文档图像的平均梯度值确定文本行的尺度,然后通过空白行的自相似性进行文本行跟踪,得到文本行的上、下边界,再通过文字笔画间距确定竖直笔画边界,完成对文本行的分割处理,处理完后,得到以一个以上、下边界和竖直边界划分得到的四边形,该四边形所包围的图像内容就是一个文字块处理单元;最后针对每个文字块处理单元,依次进行倾斜形变校正以及局部双线性插值校正,即完成对整幅文档图像的校正;本方法综合考虑了处理速度及扭曲文档图像的复杂情况,具有校正过程速度较快、校正效果好的特点。

    一种半色调文档图像的噪声处理方法

    公开(公告)号:CN101567049B

    公开(公告)日:2011-11-16

    申请号:CN200910022698.6

    申请日:2009-05-26

    Abstract: 本发明涉及计算机视觉和图形、图像处理领域,公开了一种半色调文档图像的噪声处理方法。它包括以下步骤:首先,将半色调文档图像分为四类;其次,对于浅色背景和深色文字的半色调文档图像,采用基于连通区域标记的方法去除背景噪声;对于浅色背景和浅色文字的半色调文档图像,采用基于高斯平滑滤波的方法去除背景噪声;对于深色背景和深色文字的半色调文档图像、深色背景和浅色文字的半色调文档图像,采用基于维纳滤波的方法去除背景噪声;最后,观察去除背景噪声的半色调文档图像,构造文字的毛刺去除模板和缺陷修复模板,通过模板匹配去除文字毛刺和修复文字缺陷。

    流输入读取的多媒体扩展指令的设计与实现方法

    公开(公告)号:CN100511278C

    公开(公告)日:2009-07-08

    申请号:CN200610105066.2

    申请日:2006-08-29

    Abstract: 本发明公开了一种流输入读取的多媒体扩展指令的设计与实现方法,该方法针对音视频解码中流数据输入读取设计了4条媒体扩展指令,其硬件实现结构包括两个32比特的缓冲寄存器、读取码流的地址寄存器(Addr)、Flag标志寄存器、Left寄存器与两个任意位移位器;该扩展指令包括指令读初始化(Bini),码流读取(Bread),数据装载(Bload),当前码流地址返回(Bpos)构成,并设计了该流数据读取指令的硬件实现电路以及在处理器中的流水线划分,给出了其在基于SPARC V8处理器中具体指令编码方式,实验证明该扩展指令的效率是手工优化的SPARC V8处理器指令实现的5-8倍。能够有效的提高处理器对多媒体解码处理的性能。

Patent Agency Ranking