-
公开(公告)号:CN119360951B
公开(公告)日:2025-05-09
申请号:CN202411906873.9
申请日:2024-12-24
Applicant: 中国石油大学(华东)
Abstract: 本发明涉及生物技术领域,特别涉及基于矩阵增强和协作双矩阵补全的SM‑miRNA关联预测方法,包括以下步骤:步骤1、通过高斯径向基函数分别增强综合的SM相似性矩阵和综合的miRNA相似性矩阵的精度;步骤2、通过截断schatten p‑范数最小化获得一个在[0,1]范围内的概率值,并将获得的概率值替换SM‑miRNA关联矩阵的缺失数据,更新SM‑miRNA关联矩阵;步骤3、对步骤2中更新后的SM‑miRNA关联矩阵进行截断矩阵分解,分解后结合步骤1中增强后的综合的SM相似性矩阵和综合的miRNA相似性矩阵计算,获得预测得分矩阵,并根据预测得分矩阵预测结果,通过上述技术方案,本发明具有提高相似度量的准确性和模型计算速度、预测时全面且灵活的优点。
-
公开(公告)号:CN119626348A
公开(公告)日:2025-03-14
申请号:CN202411833243.3
申请日:2024-12-13
Applicant: 中国石油大学(华东)
IPC: G16B40/30 , G06N3/0895 , G06F18/23213
Abstract: 本发明属于生物信息学技术领域,特别涉及一种基于深度协同对比学习的单细胞多组学数据聚类框架。本发明中的框架充分利用细胞间的关联关系,同时进一步加强同一细胞在不同组学数据间的特征交互,以实现多组学数据的高效聚类。为了充分利用细胞间的拓扑信息,本发明设计了在不同组学下的图自编码器与特征信息增强模块,实现对细胞的特征进行提取与信息增强。同时,引入了对比学习技术加强同一细胞不同组学特征间的交互,最后通过多组学深度协同聚类模块实现单细胞多组学聚类。
-
公开(公告)号:CN118761416B
公开(公告)日:2025-01-21
申请号:CN202411251998.2
申请日:2024-09-09
Applicant: 中国石油大学(华东)
IPC: G06F40/295 , G06F40/30 , G06N3/045 , G06F18/232 , G06N7/01
Abstract: 本发明属于实体识别技术领域,特别涉及通过预训练BERT进行化学生产命名实体识别的方法。该方法包括S1、将需要识别的文本输送到预训练的LM嵌入模型ChemBERT中,从而获得语义表示向量和语义检索库;S2、将解码器应用到步骤S1的语义表示向量上;S3、使用解码标签和KNN聚类标签进行投票,投票的结果用作最终输出。该方法解决了现有的实体识别方法出现的数据集中存在长尾数据和小样本数据的问题。
-
公开(公告)号:CN119296637A
公开(公告)日:2025-01-10
申请号:CN202411844496.0
申请日:2024-12-16
Applicant: 中国石油大学(华东)
Abstract: 本发明属于生物信息和计算机技术领域,特别涉及基于矩阵补全和双策略图推理的药物‑疾病关联预测方法。该方法首先计算药物和疾病的高斯核和拉普拉斯核相似度,然后使用非线性融合技术对其进行融合。该方法以药物‑疾病异构网络的邻接矩阵为目标矩阵,通过截断反正切秩最小化来增强药物‑疾病关联网络边缘的鲁棒性和可形成性。该方法主要关注药物和疾病的邻近节点,过滤掉更远节点的潜在噪声。此外,该方法基于药物‑疾病异构网络采用自上向下和自下向上的策略来预测药物‑疾病关联。双策略的协同作用可以增强对异构图中复杂结构和跨域关联的综合处理能力,保证网络中丰富的信息得到充分利用。
-
公开(公告)号:CN118761416A
公开(公告)日:2024-10-11
申请号:CN202411251998.2
申请日:2024-09-09
Applicant: 中国石油大学(华东)
IPC: G06F40/295 , G06F40/30 , G06N3/045 , G06F18/232 , G06N7/01
Abstract: 本发明属于实体识别技术领域,特别涉及通过预训练BERT进行化学生产命名实体识别的方法。该方法包括S1、将需要识别的文本输送到预训练的LM嵌入模型ChemBERT中,从而获得语义表示向量和语义检索库;S2、将解码器应用到步骤S1的语义表示向量上;S3、使用解码标签和KNN聚类标签进行投票,投票的结果用作最终输出。该方法解决了现有的实体识别方法出现的数据集中存在长尾数据和小样本数据的问题。
-
公开(公告)号:CN117690484A
公开(公告)日:2024-03-12
申请号:CN202311752368.9
申请日:2023-12-19
Applicant: 中国石油大学(华东)
IPC: G16B20/30 , G16B40/00 , G06F18/2433 , G06F18/25 , G06N3/042 , G06N3/0464 , G06N3/084
Abstract: 本发明是一种基于掩码机制和图神经网络蛋白质作用位点预测模型,旨在通过这一创新模型优化蛋白质相互作用预测,为生物信息学领域提供新的研究途径。具体步骤包括:1)引入基于结构的掩码机制,通过对蛋白质结构进行有选择性的屏蔽或强调,提高模型对关键结构特征的关注度;2)基于残基的图神经网络模块的设计,包括节点表示学习、图的构建、图神经网络层和特征聚合等步骤,以全面捕捉蛋白质结构中残基之间的复杂相互关系;3)结合这两个关键模块,建立蛋白质相互作用预测模型,通过动态调整策略以适应不同蛋白质结构的特征,提高模型的适应性和准确性。这一综合模型将为蛋白质相互作用研究提供新的理论和方法支持。
-
公开(公告)号:CN115101117A
公开(公告)日:2022-09-23
申请号:CN202210418389.6
申请日:2022-04-20
Applicant: 中国石油大学(华东)
Abstract: 本发明涉及一种基于孪生‑集成神经网络的蛋白质蛋白质相互作用预测模型,包括:(1)蛋白质序列对输入到编码层,每一个蛋白编码成1000*N的特征矩阵;(2):把这一对蛋白质特征输入到孪生‑集成神经网络进一步提取特征。集成神经网络由MCN和MBC构成。相同的集成神经网络共享参数,构成了孪生神经网络。我们的特征提取是从全局和局部共同提取特征。MCN通过调整不同的kernel‑size可以专注于提取蛋白质特征的局部信息,MBC可以整体提取蛋白质序列的全局信息,输出是四个256维的向量(3):把这四个256维的特征向量通过concatenation操作合并成1024维的特征向量,随后通过多层感知机来最终输出模型的预测结果。根据数据集原始的标签和模型预测结果,通过损失函数评价模型性能,反向传播来更新模型参数。
-
公开(公告)号:CN114038516A
公开(公告)日:2022-02-11
申请号:CN202111414061.9
申请日:2021-11-25
Applicant: 中国石油大学(华东)
Abstract: 本发明提出了一种基于变分自编码器的分子生成与优化,其特征在于,包括如下步骤:步骤1、将分子分解为子结构;步骤2、在变分自编码器和门控神经网络基础上构建生成模型,并通过该生成模型将子结构转变为分子子结构树,通过逐步添加子结构的方式生成化合物分子;步骤3、利用优化模型对化合物分子的隐向量进行优化,最终形成优化后的化合物分子,借此,本发明将分子转变为分子子结构树,在解码器过程中提出一种自回归模型,该模型通过逐步添加子结构的方式生成化合物分子,模型较好地学习到了分子子结构之间的连接关系,规避了节点添加过程中的化合价检测,解决了现有技术中的问题。
-
公开(公告)号:CN113593633A
公开(公告)日:2021-11-02
申请号:CN202110878705.3
申请日:2021-08-02
Applicant: 中国石油大学(华东)
Abstract: 本发明提出了一种基于卷积神经网络的药物‑蛋白相互作用预测模型,该预测模型的构建方法如下:步骤1、为靶点蛋白质的结合位点构建包围盒描述符,利用三层3D卷积神经网络提取多通道的结合位点空间结构特征;步骤2、基于靶点蛋白质的氨基酸序列,利用三层1D卷积神经网络提取蛋白质的氨基酸构成特征;步骤3、为待筛选的药物分子构建分子图,利用三层图卷积神经网络提取药物分子特征;步骤4、将得到的所有特征进行组合得到整体特征后,输入至两层全连接网络预测药物‑蛋白的相互作用,借此,本发明具有不仅考虑了与对接过程密切相关的结合位点的局部特征,还考虑了蛋白质的全局特征,并将这些特征预测化合物‑蛋白质相互作用的优点。
-
公开(公告)号:CN119360951A
公开(公告)日:2025-01-24
申请号:CN202411906873.9
申请日:2024-12-24
Applicant: 中国石油大学(华东)
Abstract: 本发明涉及生物技术领域,特别涉及基于矩阵增强和协作双矩阵补全的SM‑miRNA关联预测方法,包括以下步骤:步骤1、通过高斯径向基函数分别增强综合的SM相似性矩阵和综合的miRNA相似性矩阵的精度;步骤2、通过截断schatten p‑范数最小化获得一个在[0,1]范围内的概率值,并将获得的概率值替换SM‑miRNA关联矩阵的缺失数据,更新SM‑miRNA关联矩阵;步骤3、对步骤2中更新后的SM‑miRNA关联矩阵进行截断矩阵分解,分解后结合步骤1中增强后的综合的SM相似性矩阵和综合的miRNA相似性矩阵计算,获得预测得分矩阵,并根据预测得分矩阵预测结果,通过上述技术方案,本发明具有提高相似度量的准确性和模型计算速度、预测时全面且灵活的优点。
-
-
-
-
-
-
-
-
-