一种基于多源迁移学习的噬菌体启动子预测方法

    公开(公告)号:CN114121145A

    公开(公告)日:2022-03-01

    申请号:CN202111421890.X

    申请日:2021-11-26

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于多源迁移学习的噬菌体启动子预测方法,包括以下步骤:数据集构建:收集目标域和多源域正样本,对不同域正样本使用组间打乱方法进行重构,得到相应目标域和多源域负样本,最终得到正负样本比例平衡的目标域和多源域数据集;多源迁移学习模型构建:包括数据预处理、特征提取、特征对齐和目标分类四个功能模块;模型训练:将数据集划分为训练集和验证集,训练集用于对模型进行构建与训练,验证集用于模型参数调整,获取最优的模型;模型预测。本发明对小样本数据采用多源迁移学习的方式,以构建最优的模型对噬菌体启动子进行预测与分类,提高了预测效果,为后续噬菌体启动子预测和其他调控元件的预测发展做出了贡献。

Patent Agency Ranking