一种癌症驱动基因识别方法及系统

    公开(公告)号:CN115762631A

    公开(公告)日:2023-03-07

    申请号:CN202211240155.3

    申请日:2022-10-11

    Applicant: 安徽大学

    Abstract: 一种癌症驱动基因识别方法及系统,方法为:S1、收集正常样本与肿瘤样本的多组学数据,计算出组学特征值和网络结构特征值;S2、将处理后的组学特征值和网络结构特征值进行拼接,构建新的融合特征;另外使用集成学习的方法建立模型,使用序列前向选择策略对模型的第一层分类器进行筛选,第二层分类器采用逻辑回归对第一层分类器的结果赋予权重;S3、将新的融合特征输入到第一层的分类器,获得对应数量的分类器的预测概率;S4、将第一层的所有分类器的预测概率拼接后作为特征输入第二层的逻辑回归分类器进行拟合,最终模型输出表示基因成为驱动基因的概率。本发明同时考虑分子特征和网络结构特征,并克服了单个分类器性能偏差问题。

Patent Agency Ranking