-
公开(公告)号:CN113486922B
公开(公告)日:2024-09-24
申请号:CN202110611935.3
申请日:2021-06-01
Applicant: 安徽大学
IPC: G06F18/2413 , G16B20/00 , G16H50/70 , G06F18/25 , G06F18/23
Abstract: 本发明公开了一种基于栈式自编码器的数据融合优化方法,包括以下步骤:S1:利用栈式自编码器对获取的癌症患者多组学数据进行降维,得到能够代表原始数据的低维潜在表示;S2:利用步骤S1得到的降维之后的组学数据,基于径向基函数和利用欧氏距离度量样本之间的亲密程度,计算出相似矩阵;S3:为每个组学数据定义相对相似矩阵,利用归一化因子控制样本的密度;S4:对融合得到的平均相对相似矩阵进行谱聚类,从而对癌症患者进行亚型划分。还公开了一种基于栈式自编码器的数据融合优化系统。本发明能够对高维度、多噪声的组学数据进行降维和融合,准确有效地对癌症进行亚型聚类,能有效提升癌症亚型聚类效果。
-
公开(公告)号:CN117746981A
公开(公告)日:2024-03-22
申请号:CN202311568554.7
申请日:2023-11-23
Applicant: 安徽大学
Abstract: 本发明涉及基因数据分析技术领域,为高质量同义突变数据集的构建提出了一种新的方法,尤其涉及一种面向同义突变数据的筛选方法,该方法包括以下步骤:S1、从公开的数据库中获取不同的同义突变数据构成数据集,公开的数据库包括但不限于HGMD数据库、ClinVar数据库和VariSNP数据库;S2、对数据集进行预处理,并将数据集中的致病同义突变数据按照比例划分为训练集和测试集;S3、使用CD‑HIT‑2D去除训练集与测试集之间数据的相似性。本发明旨在提供一种有效的方法,用于获取生物信息中的同义突变数据,从而构建出高质量的同义突变数据集,以帮助了解基因变异的功能影响。
-
公开(公告)号:CN119993258A
公开(公告)日:2025-05-13
申请号:CN202510072516.5
申请日:2025-01-17
Applicant: 安徽大学
Abstract: 本发明公开了一种预测药物‑靶点相互作用的方法、模型、设备及介质,方法包括:生成药物‑蛋白质特征向量子图;应用图注意力采样,对子图中心节点进行更新;采用NDLS进行特征向量的自适应迭代优化;同时采用图SAGE更新中心节点的特征向量,获取节点多源信息;通过双层GTN对节点多源信息进行信息聚合,输出预测值。本发明采用NDLS进行节点特征的自适应迭代优化,采用了图SAGE对邻域节点深层采样聚合,关注网络节点不同层级感受野;有效地从邻域中聚合更多相关节点信息;本发明方法考虑了网络节点不同层级的感受野,通过融合各自互补的优势,从而有效地从邻域中聚合更多相关节点信息,进一步提升了DTI预测模型的预测能力。
-
公开(公告)号:CN116189798A
公开(公告)日:2023-05-30
申请号:CN202310039518.5
申请日:2023-01-13
Applicant: 安徽大学
Abstract: 一种多功能生物活性肽预测方法及系统,方法包括以下步骤:S1、对数据进行预处理;对氨基酸序列数据转换为数字化数据;S2、对数据化数据进行特征提取;先使用多尺度TCN获取序列中不同长度序列模式的信息,然后利用GRU得到各序列模式之间的关系,最终得到具有全局信息的特征表示;S3、目标分类;将具有分类功能的全连接神经网络对多功能生物活性肽数据进行分类;S4、模型训练;将多功能生物活性肽数据集按照五折交叉验证的方式划分训练集和验证集,最终获取最优的模型;S5、使用模型进行预测。本申请基于多标签学习和时间循环神经网络,我们提出了一个多标签预测器,用以识别生物活性肽的多种功能,包括抗癌、抗糖尿病、抗高血压、抗炎和抗微生物。
-
公开(公告)号:CN114983342A
公开(公告)日:2022-09-02
申请号:CN202210604915.8
申请日:2022-05-30
Applicant: 安徽大学
Abstract: 本发明涉及生物信息计算技术领域,解决了将组织病理图像数据与miRNA数据有效整合的技术问题,尤其涉及一种基于深度学习的乳腺癌放疗敏感性预测方法,包括以下过程:从TCGA数据库中获取接受放疗的女性乳腺癌患者的组织病理图像数据以及miRNA数据;还涉及一种应用于上述乳腺癌放疗敏感性预测方法的系统,包括:数据集获取模块用于从TCGA数据库中获取接受放疗的女性乳腺癌患者的组织病理图像数据以及miRNA数据。本发明达到了对乳腺癌患者的放疗敏感性进行有效地预测的目的,可以较为准确地判断患者是否需要接受放疗,从而可以对患者进行精准治疗,避免了时间的浪费以及放疗给患者带来的伤害。
-
公开(公告)号:CN114582508A
公开(公告)日:2022-06-03
申请号:CN202210215060.X
申请日:2022-03-04
Applicant: 安徽大学
Abstract: 本发明公开了一种基于GCN和集成学习预测潜在关联的环状RNA‑疾病对的方法,包括:整合实验证实相关联的环状RNA‑疾病对,根据涉及到的环状RNA和疾病从相应数据库中获取序列信息和语义信息;利用图卷积神经网络并基于关联信息,环状RNA的相似性以及疾病间的相似性信息提取环状RNA的特征以及疾病的特征;构建正负样本平衡的数据集,并用其训练4基本分类器,并利用集成学习中的平均法结合策略对此些分类器集成并对所有未验证的环状RNA‑疾病对做出预测。本发明可以有效的基于已知的环状RNA‑疾病对信息预测潜在关联的环状RNA疾病对,提高预测模型的性能,为生物实验提供最有可能关联的环状RNA‑疾病对,从而促进相关生物实验的发展。
-
公开(公告)号:CN114121145A
公开(公告)日:2022-03-01
申请号:CN202111421890.X
申请日:2021-11-26
Applicant: 安徽大学
IPC: G16B5/00
Abstract: 本发明公开了一种基于多源迁移学习的噬菌体启动子预测方法,包括以下步骤:数据集构建:收集目标域和多源域正样本,对不同域正样本使用组间打乱方法进行重构,得到相应目标域和多源域负样本,最终得到正负样本比例平衡的目标域和多源域数据集;多源迁移学习模型构建:包括数据预处理、特征提取、特征对齐和目标分类四个功能模块;模型训练:将数据集划分为训练集和验证集,训练集用于对模型进行构建与训练,验证集用于模型参数调整,获取最优的模型;模型预测。本发明对小样本数据采用多源迁移学习的方式,以构建最优的模型对噬菌体启动子进行预测与分类,提高了预测效果,为后续噬菌体启动子预测和其他调控元件的预测发展做出了贡献。
-
-
-
-
-
-