-
公开(公告)号:CN119418780A
公开(公告)日:2025-02-11
申请号:CN202510014140.2
申请日:2025-01-06
Applicant: 苏州大学
IPC: G16B40/00 , G16B30/00 , G06F18/213 , G06F18/25
Abstract: 本发明提供一种基于序列信息的蛋白质毒性预测方法和系统,方法包括从蛋白质数据库中获取多个蛋白质序列;对所有蛋白质序列进行特征计算,得到六大类蛋白质特征向量;将六大类特征向量按列拼接,得到第一特征向量;对第一特征向量进行降维筛选,得到目标维度的第二特征向量;利用第二特征向量训练基于图注意力的神经网络模型,并将训练好的神经网络模型作为蛋白质毒性预测模型;将新的蛋白质序列输入至蛋白质毒性预测模型,得到蛋白质毒性预测模型输出的毒性预测结果。本发明能够适应不同类型的蛋白质序列,通过学习到的通用序列模式对蛋白质毒性准确预测。