基于序列信息的蛋白质毒性预测方法和系统

    公开(公告)号:CN119418780A

    公开(公告)日:2025-02-11

    申请号:CN202510014140.2

    申请日:2025-01-06

    Applicant: 苏州大学

    Abstract: 本发明提供一种基于序列信息的蛋白质毒性预测方法和系统,方法包括从蛋白质数据库中获取多个蛋白质序列;对所有蛋白质序列进行特征计算,得到六大类蛋白质特征向量;将六大类特征向量按列拼接,得到第一特征向量;对第一特征向量进行降维筛选,得到目标维度的第二特征向量;利用第二特征向量训练基于图注意力的神经网络模型,并将训练好的神经网络模型作为蛋白质毒性预测模型;将新的蛋白质序列输入至蛋白质毒性预测模型,得到蛋白质毒性预测模型输出的毒性预测结果。本发明能够适应不同类型的蛋白质序列,通过学习到的通用序列模式对蛋白质毒性准确预测。

Patent Agency Ranking