-
公开(公告)号:CN114582508B
公开(公告)日:2024-03-15
申请号:CN202210215060.X
申请日:2022-03-04
Applicant: 安徽大学
Abstract: 本发明公开了一种基于GCN和集成学习预测潜在关联的环状RNA‑疾病对的方法,包括:整合实验证实相关联的环状RNA‑疾病对,根据涉及到的环状RNA和疾病从相应数据库中获取序列信息和语义信息;利用图卷积神经网络并基于关联信息,环状RNA的相似性以及疾病间的相似性信息提取环状RNA的特征以及疾病的特征;构建正负样本平衡的数据集,并用其训练4基本分类器,并利用集成学习中的平均法结合策略对此些分类器集成并对所有未验证的环状RNA‑疾病对做出预测。本发明可以有效的基于已知的环状RNA‑疾病对信息预测潜在关联的环状RNA疾病对,提高预测模型的性能,为生物实验提供最有可能关联的环状RNA‑疾病对,从而促进相关生物实验的发展。
-
公开(公告)号:CN114121155A
公开(公告)日:2022-03-01
申请号:CN202111423909.4
申请日:2021-11-26
Applicant: 安徽大学
Abstract: 本发明公开了一种基于选择集成技术的致病同义突变预测方法,包括以下步骤:(1)数据获取;(2)数据预处理:对获取的数据集利用集成的K近邻缺失值填充算法进行缺失值填充;(3)模型构建:使用随机欠采样方法对不平衡数据进行处理,得到多套平衡训练集,利用该训练集训练多个基模型,构建模型池,再基于多样性对模型池中的模型进行选择集成;(4)模型训练:将不平衡基准训练集划分为构建模型的训练集和进行模型评估和参数优化的验证集,最后通过集成最优参数下的五折交叉验证模型得到最终模型;(5)模型预测。本发明通过采用随机欠采样技术和选择集成技术对同义突变领域的不平衡数据进行建模,具有较好的识别能力和覆盖能力。
-
公开(公告)号:CN113488104A
公开(公告)日:2021-10-08
申请号:CN202110638436.3
申请日:2021-06-08
Applicant: 安徽大学
Abstract: 本发明公开了一种基于局部和全局的网络中心性分析的癌症驱动基因预测方法,包括以下步骤:S1:对标准化的体细胞突变数据和基因表达数据进行预处理,表达成基因‑矩阵的形式;S2:使用预处理完成的数据对下载的PPI网络加权;S3:模型构建,使用改进的重启随机游走算法分析网络的全局和局部特征;S4:使用构建好的模型对癌症数据集进行预测,以获取驱动基因的排名向量,实现对癌症驱动基因的预测。还公开了一种基于局部和全局的网络中心性分析的癌症驱动基因预测系统。本发明能够更好地识别驱动基因,大大提高对癌症驱动基因预测的精度,为癌症的诊断和精准医疗的发展做出了贡献。
-
公开(公告)号:CN113486922A
公开(公告)日:2021-10-08
申请号:CN202110611935.3
申请日:2021-06-01
Applicant: 安徽大学
Abstract: 本发明公开了一种基于栈式自编码器的数据融合优化方法,包括以下步骤:S1:利用栈式自编码器对获取的癌症患者多组学数据进行降维,得到能够代表原始数据的低维潜在表示;S2:利用步骤S1得到的降维之后的组学数据,基于径向基函数和利用欧氏距离度量样本之间的亲密程度,计算出相似矩阵;S3:为每个组学数据定义相对相似矩阵,利用归一化因子控制样本的密度;S4:对融合得到的平均相对相似矩阵进行谱聚类,从而对癌症患者进行亚型划分。还公开了一种基于栈式自编码器的数据融合优化系统。本发明能够对高维度、多噪声的组学数据进行降维和融合,准确有效地对癌症进行亚型聚类,能有效提升癌症亚型聚类效果。
-
公开(公告)号:CN118398215A
公开(公告)日:2024-07-26
申请号:CN202410821835.7
申请日:2024-06-24
Applicant: 安徽大学
Abstract: 本发明公开了一种头颈鳞状细胞癌的放疗敏感性预测方法及设备,包括导入患者的RNA‑seq基因数据及临床信息数据;进行差异表达分析和加权基因共表达网络分析,得到与放疗相关的基因模块;进行单因素Cox分析和Lasso回归分析,筛选放疗相关模块中的基因,得到放射治疗相关重要基因;筛选出的基因进行多因素Cox分析,得到基因系数和基因得分的线性组合作为风险评分;风险评分和患者的临床特征作为梯度提升机GBM方法的输入,对患者进行生存概率预测,预测结果的中位数作为阈值将患者划分为放疗敏感或非敏感组别。本发明通过综合利用基因表达数据和患者的临床特征,为头颈鳞状细胞癌患者的放疗敏感性提供了准确的预测,有助于个体化治疗方案的制定和优化。
-
公开(公告)号:CN113488104B
公开(公告)日:2024-06-18
申请号:CN202110638436.3
申请日:2021-06-08
Applicant: 安徽大学
Abstract: 本发明公开了一种基于局部和全局的网络中心性分析的癌症驱动基因预测方法,包括以下步骤:S1:对标准化的体细胞突变数据和基因表达数据进行预处理,表达成基因‑矩阵的形式;S2:使用预处理完成的数据对下载的PPI网络加权;S3:模型构建,使用改进的重启随机游走算法分析网络的全局和局部特征;S4:使用构建好的模型对癌症数据集进行预测,以获取驱动基因的排名向量,实现对癌症驱动基因的预测。还公开了一种基于局部和全局的网络中心性分析的癌症驱动基因预测系统。本发明能够更好地识别驱动基因,大大提高对癌症驱动基因预测的精度,为癌症的诊断和精准医疗的发展做出了贡献。
-
公开(公告)号:CN114863995B
公开(公告)日:2024-05-07
申请号:CN202210325550.5
申请日:2022-03-30
Applicant: 安徽大学
IPC: G16B15/00 , G16B40/00 , G06F18/241 , G06F18/214 , G06N3/045 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于双向门控循环神经网络的沉默子预测方法,其中方法包括以下步骤:S1,收集数据集;S2,基于步骤S1中收集的所述数据集进行双向门控循环神经网络模型的构建;S3,对步骤S2中构建的模型进行训练并验证;S4,根据步骤S3中训练好的所述模型进行沉默子概率的预测。本发明对训练集数据采用多次训练,构建出最优的模型对沉默子预测与分类,为后续沉默子的预测发展做出了贡献。
-
公开(公告)号:CN114863995A
公开(公告)日:2022-08-05
申请号:CN202210325550.5
申请日:2022-03-30
Applicant: 安徽大学
Abstract: 本发明公开了一种基于双向门控循环神经网络的沉默子预测算法,其中算法包括以下步骤:S1,收集数据集;S2,基于步骤1中收集的所述数据集进行双向门控循环神经网络模型的构建;S3,对步骤2中构建的模型进行训练并验证;S4,根据步骤3中训练好的所述模型进行沉默子概率的预测。本发明对训练集数据采用多次训练,构建出最优的模型对沉默子预测与分类,为后续沉默子的预测发展做出了贡献。
-
公开(公告)号:CN114121156A
公开(公告)日:2022-03-01
申请号:CN202111423931.9
申请日:2021-11-26
Applicant: 安徽大学
IPC: G16B20/50
Abstract: 本发明公开了一种基于深度神经网络的致病同义突变相关文献预测方法,包括以下步骤:(1)数据收集与筛选:按照关键词检索文献摘要,通过和已有标准库进行比较,划分和筛选出致病同义突变相关文献和无关文献,即正负样本数据集,再通过自助法划分出训练数据集和独立测试集;(2)文本特征提取:利用Word2vec的词向量提取方法对获取的文献数据进行文本特征提取;(3)模型构建与训练;(4)模型预测和使用。本发明通过采用深度神经网络技术构建最优模型,用来从海量的文献中识别致病同义突变相关文献的信息,大大提升了致病同义突变文献信息的获取精度和速度,极大程度上减少了科研工作者的工作量,从而大大提高了科学研究效率。
-
公开(公告)号:CN112951324A
公开(公告)日:2021-06-11
申请号:CN202110161004.8
申请日:2021-02-05
Abstract: 本发明公开了一种基于欠采样的致病同义突变预测方法,包括:获取正样本即致病同义突变样本和负样本即良性同义突变样本,最终得到正负样本比例不平衡的目标数据集;对获取的不平衡的目标数据集进行特征注释,共包括14维特征;使用欠采样方法Cluster Centroid对不平衡数据集进行处理,获取平衡数据集,即在多数类中通过k‑means算法获得聚类中心后,选择聚类中心最近的样本替换整个多数类数据集,其中负样本为多数类,正样本为少数类;将所述平衡数据集根据五折交叉验证的方式划分训练集和验证集,训练集用于对模型进行构建与训练,验证集用于进行模型的参数调整,最终获取最优的模型。本方法能大大提高模型的分类的精度和鲁棒性。
-
-
-
-
-
-
-
-
-