一种基于迁移学习的TCR-表位结合预测方法及系统

    公开(公告)号:CN118016158A

    公开(公告)日:2024-05-10

    申请号:CN202410161424.X

    申请日:2024-02-05

    Applicant: 常州大学

    Abstract: 本发明公开了一种基于迁移学习的TCR‑表位结合预测方法,包括:获取TCR序列数据集,对所述TCR序列数据集进行数据处理,通过对TCR序列过滤得到表位序列,通过动态训练策略得到训练集和测试集;训练自回归编码器模型和ProtBert模型,并对TCR序列和表位序列进行特征提取,得到TCR序列特征和表位序列特征;对所述TCR序列特征和表位序列特征通过二维直方图进行数据转换,并输入到二维卷积网络中输出向量,将输出向量输入到全连接网络,得到第一输出向量,同时将二维卷积网络中输出向量合并,得到第二路网络;将第一输出向量和第二路网络通过多头注意力策略合并,对合并向量进行扁平化处理,得到全连接网络的输入,提高了TCR‑表位结合任务的预测准确性。

    一种多视图的circRNA与miRNA关系预测方法及系统

    公开(公告)号:CN117995280A

    公开(公告)日:2024-05-07

    申请号:CN202410167832.6

    申请日:2024-02-06

    Applicant: 常州大学

    Abstract: 本发明公开了一种多视图的circRNA与miRNA关系预测方法及系统,包括:从数据库中收集circRNA和miRNA数据,进行配对;构建正负样本数据集,从序列和网络层面构建表征特征;将特征数据融合为二维数据结构,得到序列特征和图嵌入特征的矩阵;基于特征转化矩阵,构建四通道的卷积神经网络,分析预测circRNA和miRNA的关系。本发明提出的方法,不仅可以应用于circRNA和miRNA的关联预测,还可以应用于其他类型的生物信息学预测任务,具有广泛的应用前景。提高预测准确性,通过对序列特征和图嵌入特征的综合利用,以及注意力机制的引入,能够提高circRNA和miRNA交互关系的预测准确性,这对于生物医学研究具有重要的意义。

    一种融合多视图特征深度集成学习的多肽溶血性预测方法

    公开(公告)号:CN118136112A

    公开(公告)日:2024-06-04

    申请号:CN202410097785.2

    申请日:2024-01-24

    Applicant: 常州大学

    Abstract: 本发明公开了一种融合多视图特征深度集成学习的多肽溶血性预测方法,涉及生物信息技术领域,包括对多肽序列进行特征的向量化;预训练模型通过大规模蛋白质数据学习多肽序列的高级表示,捕获语义和上下文信息;综合利用多肽序列特征和预训练特征,构建深度网络并融合多路数据,形成DeepHemo模型;对形成的DeepHemo模型进行评估。本发明在溶血性多肽的预测任务中取得了显著的性能提升,能够更准确地预测溶血性多肽,为相关领域的研究和应用提供了一个更可靠和有效的工具。

    非编码RNA中小开放阅读窗编码多肽能力预测方法及系统

    公开(公告)号:CN118038995B

    公开(公告)日:2024-08-23

    申请号:CN202410092859.3

    申请日:2024-01-23

    Applicant: 常州大学

    Abstract: 本发明公开了非编码RNA中小开放阅读窗编码多肽能力预测方法及系统,涉及非编码RNA中sORF编码多肽能力预测技术领域,包括采集非编码RNA中小开放阅读窗sORF编码多肽和不编码多肽序列数据,进行数据预处理;构建sORF序列和sORF序列对应的多肽序列特征空间;通过多肽序列特征空间构建融合多空间视图的深度学习模型DeepNCsORF模型;验证和评估DeepNCsORF模型。本发明通过多种特征表征来描述序列,填补了单一数据来源的不足,实现多路径信息融合,提出三路交互式注意力机制来更好地合成三个子网络的输出,充分挖掘不同网络之间的关联性,提取重要信息,预测效果优于仅考虑单一特征的方法。

    一种基于迁移学习的TCR-表位结合预测方法及系统

    公开(公告)号:CN118016158B

    公开(公告)日:2024-08-23

    申请号:CN202410161424.X

    申请日:2024-02-05

    Applicant: 常州大学

    Abstract: 本发明公开了一种基于迁移学习的TCR‑表位结合预测方法,包括:获取TCR序列数据集,对所述TCR序列数据集进行数据处理,通过对TCR序列过滤得到表位序列,通过动态训练策略得到训练集和测试集;训练自回归编码器模型和ProtBert模型,并对TCR序列和表位序列进行特征提取,得到TCR序列特征和表位序列特征;对所述TCR序列特征和表位序列特征通过二维直方图进行数据转换,并输入到二维卷积网络中输出向量,将输出向量输入到全连接网络,得到第一输出向量,同时将二维卷积网络中输出向量合并,得到第二路网络;将第一输出向量和第二路网络通过多头注意力策略合并,对合并向量进行扁平化处理,得到全连接网络的输入,提高了TCR‑表位结合任务的预测准确性。

    非编码RNA中小开放阅读窗编码多肽能力预测方法及系统

    公开(公告)号:CN118038995A

    公开(公告)日:2024-05-14

    申请号:CN202410092859.3

    申请日:2024-01-23

    Applicant: 常州大学

    Abstract: 本发明公开了非编码RNA中小开放阅读窗编码多肽能力预测方法及系统,涉及非编码RNA中sORF编码多肽能力预测技术领域,包括采集非编码RNA中小开放阅读窗sORF编码多肽和不编码多肽序列数据,进行数据预处理;构建sORF序列和sORF序列对应的多肽序列特征空间;通过多肽序列特征空间构建融合多空间视图的深度学习模型DeepNCsORF模型;验证和评估DeepNCsORF模型。本发明通过多种特征表征来描述序列,填补了单一数据来源的不足,实现多路径信息融合,提出三路交互式注意力机制来更好地合成三个子网络的输出,充分挖掘不同网络之间的关联性,提取重要信息,预测效果优于仅考虑单一特征的方法。

    一种融合特征的深度学习网络的蛋白质SNO位点预测方法

    公开(公告)号:CN117976035A

    公开(公告)日:2024-05-03

    申请号:CN202410173178.X

    申请日:2024-02-07

    Applicant: 常州大学

    Abstract: 本发明公开了一种融合特征的深度学习网络的蛋白质SNO位点预测方法,涉及蛋白质SNO位点识别技术领域,包括对蛋白质SNO修饰序列数据收集和预处理;通过数据集获取蛋白质接触图并转换为矩阵表示,使用预训练模型计算蛋白质的高维特征表示;构建第一路深度学习通道和第二路深度学习通道,融合双路深度学习通道计算蛋白质SNO修饰位点的预测概率,对结果进行分析评估。本发明所述方法通过数据集获取蛋白质接触图并转换为矩阵表示,使用预训练模型计算蛋白质的高维特征表示,提高对蛋白质性质和功能的预测能力;通过融合蛋白质图表征信息和上下文语义信息,能够更全面地描述蛋白质的特征,提高对蛋白质性质和功能的理解和预测能力。

Patent Agency Ranking