药物与靶标的相互作用预测方法、装置、设备及存储介质

    公开(公告)号:CN110415763A

    公开(公告)日:2019-11-05

    申请号:CN201910722794.5

    申请日:2019-08-06

    Inventor: 杨旸 俞植淼

    Abstract: 本申请公开了药物与靶标的相互作用预测方法、装置、设备及存储介质,属于计算机技术领域。方法包括:获取药物-靶标对的样本集;获取样本集中的药物的第一特征和靶标的第一特征;基于样本集中药物的第一特征、靶标的第一特征、以及药物-靶标对的相互作用信息,训练从药物空间到靶标空间的投影模型,得到目标投影模型;当接收到目标药物与目标靶标的预测指令时,获取目标药物的第一特征和目标靶标的第一特征,将目标药物的第一特征和目标靶标的第一特征输入目标投影模型,输出目标药物与目标靶标的相互作用结果。基于上述过程,目标投影模型的训练效果较好,基于目标投影模型预测的药物与靶标的相互作用的准确率较高。

    一种化学反应的合法性预测方法

    公开(公告)号:CN110021373A

    公开(公告)日:2019-07-16

    申请号:CN201710846223.3

    申请日:2017-09-19

    Abstract: 本发明公开了一种化学反应的合法性预测方法,具体包括如下步骤:切分,对化学反应进行信息采集,机器学习模块对化学方程式中的元素进行切分,得到独立元素;矢量化,把切分后的每个元素作为词汇单元,建立元素表,通过词嵌入的方法将每个元素映射至特定维度的向量空间中,直至将所有元素用向量表示;结果预测,机器学习模块进行化合物的特征表示以及化学反应的内在特征表示,将表示结果的特征空间通过全连接层,得到原始化合物和目标化合物的特征表示,通过计算特征向量间的距离进行合法度判断,得到并输出化成功率预测结果;分类更新,机器学习模块将化学反应的历史数据按照是否成功分为正例和负例,结合损失函数及惩罚项更新系统参数,使结果不断趋向准确。

    一种药物分子与靶标蛋白的结合亲和力预测方法

    公开(公告)号:CN113936735B

    公开(公告)日:2025-05-06

    申请号:CN202111291440.3

    申请日:2021-11-02

    Inventor: 靳远 杨旸

    Abstract: 本发明涉及一种药物分子与靶标蛋白的结合亲和力预测方法,包括:获取药物分子的SMILES序列和靶标蛋白的氨基酸序列;对于药物分子SMILES序列,将其表示为基于原子的药物原子结构图和基于子结构的药物子结构结构图;分别对药物原子结构图和药物子结构结构图进行表征学习,从而获得药物原子结构图的特征嵌入表示和药物子结构结构图的特征嵌入表示;获取氨基酸序列的特征嵌入表示;将药物分子和氨基酸的特征嵌入表示拼接,得到拼接嵌入特征表示;基于拼接嵌入表示,获得药物分子与靶标蛋白的结合亲和力预测值。上述方案,能够自适应的学习药物分子和靶标蛋白的序列和结构信息,优化药物分子与靶标蛋白的结合亲和力预测结果。

    一种基于深度学习的蛋白质-配体结合位点预测方法

    公开(公告)号:CN110689920B

    公开(公告)日:2022-02-11

    申请号:CN201910879922.7

    申请日:2019-09-18

    Abstract: 本发明公开了一种基于深度学习的蛋白质‑配体结合位点预测算法,对于待预测的蛋白质,首先提取其序列特征和距离矩阵,然后将序列特征通过滑动窗口方法分配到每个残基上,然后将残基所对应的特征逐个输入到残差神经网络和混合神经网络中,并将残差神经网络和混合神经网络的输出结果输入到Logistic回归分类器中,最终结果即为蛋白质中每个残基对应的结合概率。本发明将经典的双向长短时记忆网络和残差神经网络进行了融合,融合后的网络可以同时处理异构的蛋白质序列和结构数据,并挖掘出了序列特征和结构特征的互补性。与现有方法相比,有着更高的预测精度,且针对不同配体的数据集都有着不错的泛化性能。

    一种药物分子与靶标蛋白的结合亲和力预测方法

    公开(公告)号:CN113936735A

    公开(公告)日:2022-01-14

    申请号:CN202111291440.3

    申请日:2021-11-02

    Inventor: 靳远 杨旸

    Abstract: 本发明涉及一种药物分子与靶标蛋白的结合亲和力预测方法,包括:获取药物分子的SMILES序列和靶标蛋白的氨基酸序列;对于药物分子SMILES序列,将其表示为基于原子的药物原子结构图和基于子结构的药物子结构结构图;分别对药物原子结构图和药物子结构结构图进行表征学习,从而获得药物原子结构图的特征嵌入表示和药物子结构结构图的特征嵌入表示;获取氨基酸序列的特征嵌入表示;将药物分子和氨基酸的特征嵌入表示拼接,得到拼接嵌入特征表示;基于拼接嵌入表示,获得药物分子与靶标蛋白的结合亲和力预测值。上述方案,能够自适应的学习药物分子和靶标蛋白的序列和结构信息,优化药物分子与靶标蛋白的结合亲和力预测结果。

    一种基于深度学习的长链非编码RNA亚细胞位置预测方法

    公开(公告)号:CN107577924B

    公开(公告)日:2021-05-11

    申请号:CN201710951364.1

    申请日:2017-10-13

    Inventor: 曹真 杨旸 沈红斌

    Abstract: 本发明涉及RNA生物学领域,具体涉及一种基于深度学习的长链非编码RNA(long noncoding RNA,lncRNA)亚细胞位置预测算法。针对多分类问题训练样本中存在的类别不均衡性,本发明提出了一种新型的上采样方法来对训练样本进行预处理。采用堆叠的栈式自编码器来对序列的原始特征进行特征提取。本发明采用了基于深度学习的融合算法来整合多个分类器的预测效果。采用上采样方法大大减小了数据集的不平衡性对分类器效果的影响。在原始特征中有效提取出了区分度较高的更高层次特征。采用基于深度学习的融合算法整合各个分类器的预测结果,提高了鲁棒性,更加适应亚细胞位置多样性和复杂性的具体情形。

    一种基于深度学习的蛋白质-配体结合位点预测算法

    公开(公告)号:CN110689920A

    公开(公告)日:2020-01-14

    申请号:CN201910879922.7

    申请日:2019-09-18

    Abstract: 本发明公开了一种基于深度学习的蛋白质-配体结合位点预测算法,对于待预测的蛋白质,首先提取其序列特征和距离矩阵,然后将序列特征通过滑动窗口方法分配到每个残基上,然后将残基所对应的特征逐个输入到残差神经网络和混合神经网络中,并将残差神经网络和混合神经网络的输出结果输入到Logistic回归分类器中,最终结果即为蛋白质中每个残基对应的结合概率。本发明将经典的双向长短时记忆网络和残差神经网络进行了融合,融合后的网络可以同时处理异构的蛋白质序列和结构数据,并挖掘出了序列特征和结构特征的互补性。与现有方法相比,有着更高的预测精度,且针对不同配体的数据集都有着不错的泛化性能。

    一种基于深度学习的长链非编码RNA亚细胞位置预测算法

    公开(公告)号:CN107577924A

    公开(公告)日:2018-01-12

    申请号:CN201710951364.1

    申请日:2017-10-13

    Inventor: 曹真 杨旸 沈红斌

    Abstract: 本发明涉及RNA生物学领域,具体涉及一种基于深度学习的长链非编码RNA(long noncoding RNA,lncRNA)亚细胞位置预测算法。针对多分类问题训练样本中存在的类别不均衡性,本发明提出了一种新型的上采样方法来对训练样本进行预处理。采用堆叠的栈式自编码器来对序列的原始特征进行特征提取。本发明采用了基于深度学习的融合算法来整合多个分类器的预测效果。采用上采样方法大大减小了数据集的不平衡性对分类器效果的影响。在原始特征中有效提取出了区分度较高的更高层次特征。采用基于深度学习的融合算法整合各个分类器的预测结果,提高了鲁棒性,更加适应亚细胞位置多样性和复杂性的具体情形。

    基于注意力孪生网络的蛋白质结合位点预测方法

    公开(公告)号:CN112837747B

    公开(公告)日:2022-07-12

    申请号:CN202110041598.9

    申请日:2021-01-13

    Abstract: 一种基于注意力孪生网络的蛋白质结合位点预测方法,采用具有两层卷积层的神经网络对输入的进行特征提取,再根据提取到的特征估计绑定概率,得到预测的RNA序列绑定蛋白质的概率。本发明采用深度神经网络成对度量学习有效地增强捕获circRNA之间互信息的网络能力,并使用来自其他RBP的可用标记数据进行预训练,从而显著提高预测精确度。

Patent Agency Ranking