一种基因表达数据分类方法及分类系统

    公开(公告)号:CN105825081B

    公开(公告)日:2018-09-14

    申请号:CN201610246971.3

    申请日:2016-04-20

    Applicant: 苏州大学

    Abstract: 本申请公开了一种基因表达数据分类方法及分类系统,其中,所述基因表达数据分类方法中在获得所述基因特征数据集之后,采用聚类算法对所述基因特征数据集进行聚类,获得第一预设参数个的聚类集合,然后对所述聚类集合进行处理获得第二样本矩阵、第二训练集以及特征索引集以对基因表达数据进行降维,从而降低基因表达数据之间的冗余度,进而在很大程度上降低了在之后对所述第二训练集进行特征选择的过程中占用的计算资源以及耗费的计算时间;而采用聚类算法对所述基因特征数据集进行聚类操作所占用的计算资源以及耗费的计算时间都很少,因此采用所述基因表达数据分类方法对待测基因表达数据进行分类占用的计算资源和耗费的计算时间都较少。

    一种基因表达数据分类方法及分类系统

    公开(公告)号:CN105825081A

    公开(公告)日:2016-08-03

    申请号:CN201610246971.3

    申请日:2016-04-20

    Applicant: 苏州大学

    Abstract: 本申请公开了一种基因表达数据分类方法及分类系统,其中,所述基因表达数据分类方法中在获得所述基因特征数据集之后,采用聚类算法对所述基因特征数据集进行聚类,获得第一预设参数个的聚类集合,然后对所述聚类集合进行处理获得第二样本矩阵、第二训练集以及特征索引集以对基因表达数据进行降维,从而降低基因表达数据之间的冗余度,进而在很大程度上降低了在之后对所述第二训练集进行特征选择的过程中占用的计算资源以及耗费的计算时间;而采用聚类算法对所述基因特征数据集进行聚类操作所占用的计算资源以及耗费的计算时间都很少,因此采用所述基因表达数据分类方法对待测基因表达数据进行分类占用的计算资源和耗费的计算时间都较少。

    一种基因分类方法及相关设备

    公开(公告)号:CN108763873A

    公开(公告)日:2018-11-06

    申请号:CN201810522807.X

    申请日:2018-05-28

    Applicant: 苏州大学

    Abstract: 本发明公开了一种基因分类方法及相关设备,方法包括:对输入的作为训练样本的基因数据进行标准化处理,基因数据包括若干属性;以训练样本与异类近邻样本的间隔与训练样本与同类近邻样本的间隔的差值,以及对应属性的权重向量建立表示所有训练样本的期望间隔差的逻辑回归优化函数,并以对应属性的权重向量为范数约束项建立最小化优化模型,通过迭代运算计算得到对应属性的权重向量;根据得到的权重向量的值对属性特征排序,根据排序后的属性特征对作为训练样本的基因数据进行分类训练,获得作为分类根据的最优特征集,以对待分类基因数据进行分类。本发明提供的基因分类方法及相关设备,能够获得较高的分类精度。

    一种多分类器构建方法和系统

    公开(公告)号:CN104732242A

    公开(公告)日:2015-06-24

    申请号:CN201510163171.0

    申请日:2015-04-08

    Applicant: 苏州大学

    Abstract: 本发明的多分类器构建方法和装置,将包含多类样本数据的训练样本集处理为多个两类数据集合;且对每个两类数据集合进行特征选择,得到相应的特征索引子集;并合并多个特征索引子集得到一特征索引集合;之后对特征选择后的训练样本集进行建模,得到目标多分类器。可见,本发明通过把多类问题分解为多个两类问题,并对每个两类问题进行冗余特征剔除,使每个子分类器(可简单理解为每个特征索引子集对应一子分类器)具备了特征挑选能力;从而后续进行类别诊断时,可预先基于各子分类器的特征挑选能力对待测数据进行特征挑选(本申请具体利用各特征子集融合后所得的特征索引集合进行特征选择)。可见本申请解决了现有技术的问题,提升了诊断准确率。

    一种医疗数据的特征选择方法及相关装置

    公开(公告)号:CN108806796A

    公开(公告)日:2018-11-13

    申请号:CN201810522806.5

    申请日:2018-05-28

    Applicant: 苏州大学

    CPC classification number: G16H50/70

    Abstract: 本申请公开了一种医疗数据的特征选择方法,包括:对获取的医疗数据进行标准化处理,得到标准化医疗数据;对所述标准化医疗数据进行权重向量稀疏计算处理,得到所述标准化医疗数据中特征对应的权重向量;根据所有所述权重向量对所有所述特征进行选择,得到最优特征集。通过在特征选择的权重向量计算过程进行稀疏处理,使不相关特征的权重向量趋近于0,减少多过无关特征被选入最优特征集,相当于减少的无关噪声,提高了处理高维数据时的精度。本申请还公开一种医疗数据的特征选择系统、特征选择装置以及计算机可读存储介质,具有上述有益效果。

    基于局部学习特征权重选择的医疗数据分类方法及装置

    公开(公告)号:CN107193993A

    公开(公告)日:2017-09-22

    申请号:CN201710419357.7

    申请日:2017-06-06

    Applicant: 苏州大学

    CPC classification number: G06F16/285

    Abstract: 本发明公开了一种基于局部学习特征权重选择的医疗数据分类方法,首先根据训练样本集得到样本的属性值,根据属性值利用梯度下降的权重更新方式计算属性对应的权重向量,因此可以保证收敛性,可以较快地达到算法的停止准则,减少计算时间,降低计算复杂度;根据计算出的权重向量进行特征选择得到最优特征集,将待评估数据样本进行标准化后再最优特征子集中进行特征选择,再将特征选择后的待评估数据样本进行分类就可以使数据样本实现降维,因此本发明实施例提供的方法实现降维的同时又降低了计算的复杂度,减少了计算时间。本发明还提供了一种基于局部学习特征权重选择的医疗数据分类装置,同样可以实现上述技术效果。

    一种个人信用评估方法及装置

    公开(公告)号:CN106651574A

    公开(公告)日:2017-05-10

    申请号:CN201611264984.X

    申请日:2016-12-30

    Applicant: 苏州大学

    CPC classification number: G06Q40/025 G06K9/6256 G06K9/6269

    Abstract: 本发明公开了一种个人信用评估方法及装置,其中该方法包括:获取训练样本集,训练样本集包括具有信用标签及多个信用属性的训练样本,信用标签为对对应训练样本的信用进行评估得到的标签;选取出分类效果最好的信用属性作为最优信用属性并组成对应的最优信用属性集,将每个训练样本中包含的最优信用属性集之外的信用属性去掉,得到对应的最优训练样本集;采用支持向量机对最优训练样本集建模,得到支持向量机分类模型;获取未知信用标签且仅具有最优信用属性的待测样本并作为支持向量机分类模型的输入,得到待测样本的信用标签。由此,避免了现有技术中因为专家的主观性及随机性导致分类精度较低的问题,且具有较高的分类精度。

    一种多分类器构建方法和系统

    公开(公告)号:CN104732241A

    公开(公告)日:2015-06-24

    申请号:CN201510163098.7

    申请日:2015-04-08

    Applicant: 苏州大学

    Abstract: 本发明的多分类器构建方法和系统,本发明将包含多类样本数据的训练样本集处理为多个两类数据集合;并对每个两类数据集合进行特征选择,得到相应的训练样本子集;之后对每个训练样本子集进行建模,得到相应的子分类器。可见,本发明通过把多类问题分解为多个两类问题,并对每个两类问题进行冗余特征剔除,使每个子分类器具备了特征挑选能力;从而后续进行类别诊断时,可预先基于各子分类器的特征挑选能力对待测数据进行特征挑选,通过利用各子分类器剔除待测数据中的冗余特征,为最终得到较高准确率的类别诊断结果提供了支持。

Patent Agency Ranking