一种基于深度学习的siRNA筛选方法及装置

    公开(公告)号:CN119851749A

    公开(公告)日:2025-04-18

    申请号:CN202411824193.2

    申请日:2024-12-11

    Abstract: 本发明涉及深度学习技术领域,公开了一种基于深度学习的siRNA筛选方法及装置,该方法包括:构建siRNA抑制率预测模型;基于siRNA抑制率预测模型,获得待预测靶点mRNA序列对应的初步siRNA筛选结果;对待预测靶点mRNA序列进行分子动力学模拟,生成待预测靶点mRNA序列对应的分子动力学轨迹;构建神经关系推理模型,生成待预测靶点mRNA序列对应的相互作用关系图;基于相互作用关系图,对初步siRNA筛选结果进行再次筛选,获得最终siRNA筛选结果。本发明有效提高了深度学习模型在真实筛选任务中的准确性,避免了深度学习模型在筛选siRNA时由于训练集的偏差导致泛化能力弱等问题。

    阳离子脂质筛选模型的构建及训练方法、装置、介质及程序产品

    公开(公告)号:CN118969057B

    公开(公告)日:2024-12-17

    申请号:CN202411448109.1

    申请日:2024-10-17

    Abstract: 本申请涉及一种阳离子脂质筛选模型的构建及训练方法、装置、介质及程序产品。获取包含阳离子脂质对组织/细胞的转染效率的第一数据集和第二数据集,构建包含分子信息编码部和深度学习模型的阳离子脂质筛选模型,分子信息编码部用于生成分子结构词元字典和阳离子脂质分子信息的编码向量,并将编码向量输入深度学习模型;利用第一数据集对分子信息编码部和深度学习模型进行第一联合训练,使模型学习到阳离子脂质转染效率通用规律;利用第二数据集并结合第一数据集进行第二联合训练,直至生成与第一联合训练后分子结构词元字典基本相同的分子结构词元字典。本申请的模型泛化能力更强,转染效率预测更准确,阳离子脂质设计针对性更强,筛选效率更高。

    多肽生成方法、装置及计算机设备

    公开(公告)号:CN118982999A

    公开(公告)日:2024-11-19

    申请号:CN202411455655.8

    申请日:2024-10-17

    Abstract: 本发明涉及生物信息技术领域,公开了一种多肽生成方法、装置及计算机设备,该方法包括:基于多肽生成模型生成第一多肽;利用多肽活性预测模型,预测得到第一多肽的活性信息;利用多肽毒性预测模型,预测得到第一多肽的毒性信息;分别对多肽活性预测模型、多肽毒性预测模型进行可解释性分析;基于可解释性分析结果,对第二多肽的序列进行调整;第二多肽是多肽活性预测模型预测有活性、且多肽毒性预测模型预测无毒性的第一多肽。本发明可大大缩减多肽药物研发周期、降低研发成本,还可以提升多肽药物研发质量。

    多肽氨基酸序列生成模型训练及相关产品

    公开(公告)号:CN117711532A

    公开(公告)日:2024-03-15

    申请号:CN202410165333.3

    申请日:2024-02-05

    Abstract: 本发明提供一种多肽氨基酸序列生成模型训练及相关产品。该方法的一具体实施方式包括:通过利用与目标受体之间结合有活性的活性多肽氨基酸序列,再对活性多肽氨基酸序列进行词元切分得到活性多肽词元序列,再将活性多肽词元序列的片段和相应向后移位一个词元之后的移位词元序列分别进行特征嵌入表示,并分别作为样本特征数据的样本多肽词元特征序列和期望输出的标签词元特征序列,再以样本多肽词元特征序列作为输入数据,以标签词元特征序列作为监督数据对多肽氨基酸序列生成模型进行训练。进而,多肽氨基酸序列生成模型可以预测与目标受体之间具有结合活性的多肽氨基酸序列。

    siRNA基因抑制效率筛选模型的构建及训练方法、装置和筛选方法

    公开(公告)号:CN119296635B

    公开(公告)日:2025-04-04

    申请号:CN202411813965.2

    申请日:2024-12-11

    Abstract: 本申请提供siRNA基因抑制效率筛选模型的构建及训练方法、装置和筛选方法。所述构建及训练方法包括获取目标mRNA的第一序列信息以及siRNA的第二序列信息;获取目标mRNA的第一空间图像信息以及siRNA的第二空间图像信息;构建siRNA基因抑制效率筛选模型,利用第一序列信息和第二序列信息对第一神经网络模型进行训练,以提取序列特征;利用第一空间图像信息和第二空间图像信息对第二神经网络模型进行训练,以提取空间结构特征;将序列特征和空间结构特征进行融合,利用融合后的融合特征对第三神经网络模型进行训练。如此,能够提高筛选对靶向基因具有抑制效率的siRNA的准确度。

    多肽活性的可解释性分析方法、装置、设备、介质及产品

    公开(公告)号:CN118737293B

    公开(公告)日:2024-12-20

    申请号:CN202411203722.7

    申请日:2024-08-29

    Abstract: 本发明涉及多肽设计技术领域,公开了一种多肽活性的可解释性分析方法、装置、设备、介质及产品,该方法包括:获取待分析多肽样本对应的待分析多肽信息;基于预先建立的词元表,对多肽序列中每一个氨基酸残基进行词元切分,获得多肽信息词元集合;将多肽信息词元集合输入预先建立的多肽活性预测模型,获得待分析多肽样本对应的多肽活性类别;基于多肽活性预测模型的可解释性子模型,将多肽活性类别作为计算条件,确定待分析多肽样本中,氨基酸残基及修饰信息一一对应的活性贡献值。本发明直观解释了多肽序列及修饰信息对多肽活性的影响程度,明确每个氨基酸残基及其修饰对多肽活性的具体贡献,有利于提供精准的多肽活性评估,提高多肽设计的质量。

    多肽活性的可解释性分析方法、装置、设备、介质及产品

    公开(公告)号:CN118737293A

    公开(公告)日:2024-10-01

    申请号:CN202411203722.7

    申请日:2024-08-29

    Abstract: 本发明涉及多肽设计技术领域,公开了一种多肽活性的可解释性分析方法、装置、设备、介质及产品,该方法包括:获取待分析多肽样本对应的待分析多肽信息;基于预先建立的词元表,对多肽序列中每一个氨基酸残基进行词元切分,获得多肽信息词元集合;将多肽信息词元集合输入预先建立的多肽活性预测模型,获得待分析多肽样本对应的多肽活性类别;基于多肽活性预测模型的可解释性子模型,将多肽活性类别作为计算条件,确定待分析多肽样本中,氨基酸残基及修饰信息一一对应的活性贡献值。本发明直观解释了多肽序列及修饰信息对多肽活性的影响程度,明确每个氨基酸残基及其修饰对多肽活性的具体贡献,有利于提供精准的多肽活性评估,提高多肽设计的质量。

    多肽与受体结合活性预测模型的训练方法、装置及设备

    公开(公告)号:CN117951649A

    公开(公告)日:2024-04-30

    申请号:CN202410353566.6

    申请日:2024-03-26

    Inventor: 宋更申 赵化建

    Abstract: 本发明涉及生物医药技术领域,公开了一种多肽与受体结合活性预测模型的训练方法、装置及设备,该方法包括:获取第一样本多肽序列和第一样本受体序列;针对每一对第一样本多肽序列和第一样本受体序列,获取对应的第一序列信息对、第一结构信息对和第一活性标注值;将第一序列信息对和第一结构信息对,输入至第一活性预测模型,得到第一预测结果,并利用第一活性标注值和第一预测结果对第一活性预测模型的参数进行调整得到第二活性预测模型;获取多对第二样本多肽序列和第二样本受体序列,以及对应的第二活性标注值,对第二活性预测模型进行训练得到第三活性预测模型。本发明能够提升多肽与受体结合活性的预测准确率。

    活性多肽序列的生成方法、装置、设备及存储介质

    公开(公告)号:CN118800364B

    公开(公告)日:2024-12-20

    申请号:CN202411268893.8

    申请日:2024-09-11

    Abstract: 本发明涉及多肽设计技术领域,公开了一种活性多肽序列的生成方法、装置、设备及存储介质,该方法包括:将多肽受体的序列信息和已生成的多肽词元信息,输入至生成式深度学习模型,生成新的多肽词元信息;按照生成顺序对所述生成式深度学习模型生成的多肽词元信息进行拼接,得到目标多肽的序列信息;获取所述目标多肽的第一几何性质、所述多肽受体的第二几何性质;将所述第一几何性质和所述第二几何性质、以及所述多肽受体的序列信息和所述目标多肽的序列信息,输入至多肽活性预测模型,预测得到所述目标多肽和所述多肽受体的结合活性。本发明能够显著提高活性多肽设计的效率和质量,从而实现高通量的活性多肽设计。

    mRNA加帽类似物生成方法、装置、设备及存储介质

    公开(公告)号:CN118506881B

    公开(公告)日:2024-10-08

    申请号:CN202410946642.4

    申请日:2024-07-15

    Abstract: 本发明涉及mRNA药物设计技术领域,公开了一种mRNA加帽类似物生成方法、装置、设备及存储介质,该方法包括:将起始词元对应的词元特征信息输入至预先训练完成的生成式人工智能模型,生成多个第一词元特征信息;将新生成的多个第一词元特征信息解码为对应的词元,并进行词元拼接,得到目标mRNA加帽类似物的结构信息;若目标mRNA加帽类似物的结构信息合理有效,且与已有的mRNA加帽类似物的结构信息不同,则确定目标mRNA加帽类似物的结构信息是新生成的mRNA加帽类似物的结构信息。本发明能够大大提高生成合理有效的新型mRNA加帽类似物的概率和效率。

Patent Agency Ranking