一种烟草线粒体RNA编辑位点高精度预测方法

    公开(公告)号:CN108595914A

    公开(公告)日:2018-09-28

    申请号:CN201810468630.X

    申请日:2018-05-16

    Abstract: 本发明公开了一种烟草线粒体RNA编辑位点高精度预测方法,下载拟南芥、欧洲油菜和稻三个样本的线粒体全基因组序列,提取位点信息;融合烟草ATP合酶上的atp9,atp6,orf25,orfB,atp1五个目的基因的DNA序列和cDNA序列比对得到的编辑位点数据共同组成数据集;从全基因组中得到负样本;确定最优特征;针对最优特征,对训练集-测试集按照9:1、8:2、7:3、6:4、5:5进行分类,基于高维特征快速非线性汰选方法对五种比例的训练集-测试集中的训练集进行高维特征筛选;基于高维特征筛选后保留的有效特征,利用SVC分别对测试集和验证集进行独立预测,得到有效模型;确定最优模型;本发明适用于烟草线粒体RNA编辑位点预测,减少了预测的计算量,并保证了预测的高精度。

    一种烟草线粒体RNA编辑位点高精度预测方法

    公开(公告)号:CN108595914B

    公开(公告)日:2021-06-25

    申请号:CN201810468630.X

    申请日:2018-05-16

    Abstract: 本发明公开了一种烟草线粒体RNA编辑位点高精度预测方法,下载拟南芥、欧洲油菜和稻三个样本的线粒体全基因组序列,提取位点信息;融合烟草ATP合酶上的atp9,atp6,orf25,orfB,atp1五个目的基因的DNA序列和cDNA序列比对得到的编辑位点数据共同组成数据集;从全基因组中得到负样本;确定最优特征;针对最优特征,对训练集‑测试集按照9:1、8:2、7:3、6:4、5:5进行分类,基于高维特征快速非线性汰选方法对五种比例的训练集‑测试集中的训练集进行高维特征筛选;基于高维特征筛选后保留的有效特征,利用SVC分别对测试集和验证集进行独立预测,得到有效模型;确定最优模型;本发明适用于烟草线粒体RNA编辑位点预测,减少了预测的计算量,并保证了预测的高精度。

Patent Agency Ranking