作物线粒体编辑位点预测方法、系统及存储介质

    公开(公告)号:CN119068978A

    公开(公告)日:2024-12-03

    申请号:CN202310631135.7

    申请日:2023-05-31

    Inventor: 周玮 覃思东

    Abstract: 本发明公开了一种作物线粒体编辑位点预测方法、系统及存储介质,获取多个物种的线粒体基因组序列和对应的C‑to‑U RNA编辑位点注释信息;以编辑位点为中心,在线粒体基因组序列和对应的C‑to‑U RNA编辑位点注释信息序列上游、下游各取设定长度的片段作为正样本;以无编辑位点注释的任一位点为中心,在线粒体基因组序列和对应的C‑to‑U RNA编辑位点注释信息上游、下游各取设定长度的片段作为负样本;利用各物种对应的部分正样本和负样本构建各个物种的训练集,将各物种的训练集作为卷积神经网络的输入,得到各物种对应的最优预测模型。本发明预测精度高,能够更好的拟合出不同物种C‑to‑U RNA编辑的潜在编码机理。

    酚对发光菌毒性预测及评估的非线性高效模型构建方法及应用

    公开(公告)号:CN103077313B

    公开(公告)日:2016-12-28

    申请号:CN201310007830.2

    申请日:2013-01-09

    Abstract: 本发明公开了一种酚对发光菌毒性预测及评估的非线性高效模型的构建方法及应用,利用非线性SVR技术对源自现有技术的18个酚类化合物对发光菌的毒性表示为log EC50进行QSAR研究。这项工作的目的是基于低维特征数据和高维特征数据,通过非线性化学计量学工具寻找更合理的特征和更可靠的QSAR模型,并详细分析与毒性相关的最有价值模型及其最关键的分子特征。本发明将为设计对发光菌毒性增强或减弱的酚类似物提供有效的理论参考。

    酚对发光菌毒性预测及评估的新型非线性高效模型构建方法及应用

    公开(公告)号:CN103077313A

    公开(公告)日:2013-05-01

    申请号:CN201310007830.2

    申请日:2013-01-09

    Abstract: 本发明公开了一种酚对发光菌毒性预测及评估的新型非线性高效模型的构建方法及应用,利用非线性SVR技术对源自现有技术的18个酚类化合物对发光菌的毒性表示为log EC50进行QSAR研究。这项工作的目的是基于低维特征数据和高维特征数据,通过非线性化学计量学工具寻找更合理的特征和更可靠的QSAR模型,并详细分析与毒性相关的最有价值模型及其最关键的分子特征。本发明将为设计对发光菌毒性增强或减弱的酚类似物提供有效的理论参考。

    一种烟草线粒体RNA编辑位点高精度预测方法

    公开(公告)号:CN108595914A

    公开(公告)日:2018-09-28

    申请号:CN201810468630.X

    申请日:2018-05-16

    Abstract: 本发明公开了一种烟草线粒体RNA编辑位点高精度预测方法,下载拟南芥、欧洲油菜和稻三个样本的线粒体全基因组序列,提取位点信息;融合烟草ATP合酶上的atp9,atp6,orf25,orfB,atp1五个目的基因的DNA序列和cDNA序列比对得到的编辑位点数据共同组成数据集;从全基因组中得到负样本;确定最优特征;针对最优特征,对训练集-测试集按照9:1、8:2、7:3、6:4、5:5进行分类,基于高维特征快速非线性汰选方法对五种比例的训练集-测试集中的训练集进行高维特征筛选;基于高维特征筛选后保留的有效特征,利用SVC分别对测试集和验证集进行独立预测,得到有效模型;确定最优模型;本发明适用于烟草线粒体RNA编辑位点预测,减少了预测的计算量,并保证了预测的高精度。

    一种烟草线粒体RNA编辑位点高精度预测方法

    公开(公告)号:CN108595914B

    公开(公告)日:2021-06-25

    申请号:CN201810468630.X

    申请日:2018-05-16

    Abstract: 本发明公开了一种烟草线粒体RNA编辑位点高精度预测方法,下载拟南芥、欧洲油菜和稻三个样本的线粒体全基因组序列,提取位点信息;融合烟草ATP合酶上的atp9,atp6,orf25,orfB,atp1五个目的基因的DNA序列和cDNA序列比对得到的编辑位点数据共同组成数据集;从全基因组中得到负样本;确定最优特征;针对最优特征,对训练集‑测试集按照9:1、8:2、7:3、6:4、5:5进行分类,基于高维特征快速非线性汰选方法对五种比例的训练集‑测试集中的训练集进行高维特征筛选;基于高维特征筛选后保留的有效特征,利用SVC分别对测试集和验证集进行独立预测,得到有效模型;确定最优模型;本发明适用于烟草线粒体RNA编辑位点预测,减少了预测的计算量,并保证了预测的高精度。

Patent Agency Ranking