-
公开(公告)号:CN113764031B
公开(公告)日:2023-07-18
申请号:CN202111089684.3
申请日:2021-09-16
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种跨组织/物种RNA序列中N6甲基腺苷(m6A)位点的预测方法,步骤为:获取跨物种/组织的正样本序列和等量的负样本序列;使用STREME方法进行motif挖掘;使用启发自NLP的ELMo方法进行特征编码;构建预测模型,输入数据获得初步预测结果;调整训练后预测模型中的参数,对训练后的预测模型进行优化;使用IG方法对模型进行可解释性分析;使用5折交叉验证和独立测试评估预测模型。该方法使用ELMo进行特征编码,无需利用生物学先验知识,利用深度网络挖掘序列深层信息,提高了预测m6A修饰位点的准确率。
-
公开(公告)号:CN114898147A
公开(公告)日:2022-08-12
申请号:CN202210496116.3
申请日:2022-05-09
Applicant: 桂林电子科技大学
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06V10/40 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明是一种基于双端多注意力学习的新冠肺炎胸片图像分类系统,尤其涉及医学图像处理领域。近年来,深度学习模型广泛应用于计算机视觉的多个领域,并且取得了突破性进展。例如器官组织分割、肺部病理检测,以及诊断报告的自动生成。这促使许多研究人员尝试使用深度学习技术来解决目前的困境。然而,这些早期的研究由于数据限制和不统一以及模型的单调,在大数据集上的诊断效果并没有那么理想。注意机制目的是让深度学习模型能够重点关注关键信息,从而学习更具鉴别性的特征表示。根据已有的研究,将注意机制融入深度模型已经在定位、跟踪、视觉问题回答和分割等视觉任务上取得重大突破。所提出的系统将多种网络和多种注意力机制结合,提高了新冠肺炎的筛查效率和诊断精度。实验结果也证明了该系统可以成为新冠肺炎疾病诊断的自动化解决方案。
-
公开(公告)号:CN114627328A
公开(公告)日:2022-06-14
申请号:CN202111041212.0
申请日:2021-09-07
Applicant: 桂林电子科技大学
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明是一种融合张量网络和神经网络的病理学图像分类系统,涉及医学图像处理领域。虽然深度学习方法拥有良好的性能,但是它在算力和时间成本的消耗上十分巨大。相对于深度神经网络,张量网络消耗的资源要低的多,但是在性能上有所欠缺。将密集卷积神经网络层与层之间密集连接的性质与张量网络相结合,提出了该系统,可以解决此种困境。使用该系统在两个公开的病理学影像数据集上进行二分类任务。实验证明该系统能获得与深度学习方法相当甚至更有竞争力的性能,并且使用更少的计算资源。
-
公开(公告)号:CN111755074A
公开(公告)日:2020-10-09
申请号:CN202010636957.0
申请日:2020-07-03
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种酿酒酵母菌中DNA复制起点的预测方法,步骤为:获取酿酒酵母菌中的正样本序列和负样本序列;使用二进制编码法和PSEKNC-I两种方法提取特征;使用F-score和IFS方法对PSEKNC-I法得到的特征进行筛选,得到预筛选特征;将二进制编码法得到特征和预筛选特征进行组合,获得特征组合后的样本数据集;构建CNN预测模型并训练,输入数据获得初步预测结果;调整训练后CNN预测模型中参数,对训练后的CNN预测模型进行优化;使用五折交叉验证法对优化后的CNN预测模型进行评估最终得到最优的CNN预测模型,将数据输入最优模型中,得到最终的预测结果。该方法提取多种DNA信息中的特征,减少了计算时间,避免过拟合现象,选出最优的分类模型,提高了预测复制起点预测的准确率。
-
公开(公告)号:CN109935332A
公开(公告)日:2019-06-25
申请号:CN201910158307.7
申请日:2019-03-01
Applicant: 桂林电子科技大学
Abstract: 本发明公开一种基于双随机游走模型的miRNA-疾病关联预测方法,其特征在于,包括如下步骤:1)获取已知miRNA-疾病关联数据集,构建关于miRNA-疾病关联的邻接矩阵;2)分别构建miRNA和疾病的高斯相互作用属性核相似性矩阵;3)构建miRNA功能相似性矩阵以及疾病语义相似性矩阵;4)使用相似网络融合算法整合疾病和miRNA的相似性;5)依据双随机游走模型来预测miRNA-疾病关联关系。这种方法成本低、耗时短,比现有的方法预测精度高。
-
公开(公告)号:CN109859798A
公开(公告)日:2019-06-07
申请号:CN201910053867.6
申请日:2019-01-21
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种细菌中sRNA与其靶标mRNA相互作用的预测方法,包括如下步骤:1)数据收集和整理;2)特征提取,将数据集转换为矩阵;3)F-score特征优化;4)训练构建SVM模型并进行预测得出预测结果。这种方法能有效表征RNA序列信息、提高sRNA-靶标mRNA相互作用预测精度,同时,这种方法还具有成本低、耗时少、预测速度快的优点。
-
公开(公告)号:CN119763652A
公开(公告)日:2025-04-04
申请号:CN202411931086.X
申请日:2024-12-26
Applicant: 桂林电子科技大学
IPC: G16B15/30 , G16B30/00 , G16B40/00 , G16C20/50 , G16C20/70 , G06N3/042 , G06N3/0464 , G06N3/0895 , G06N3/09
Abstract: 本发明公开了一种基于多层次对比学习和等变图神经网络的药物靶点亲和力预测方法MLC‑DTA。该方法将预测问题转化为多层次(分子层次、网络层次)分子图的回归问题,利用AlphaFold2和RDKit分别获取蛋白质分子和药物分子的三维坐标,并分别通过等变图神经网络从分子层次捕获信息。药物靶点亲和力关系图则采用图卷积网络从网络层次捕获信息。这些多层次图嵌入经过对比学习策略后得到更具代表性的特征,最终通过MLP多层感知机输出预测回归值。MLC‑DTA模型在两个经典数据集上进行了预测,并通过Grid Search优化参数。划分训练集和测试集对模型性能进行评估,使用均方误差、一致性指数和回归趋向均值三个评估指标衡量模型性能。案例分析验证了模型的泛化能力,相比于最先进的方法,MLC‑DTA有了显著的性能提升。
-
公开(公告)号:CN118824353A
公开(公告)日:2024-10-22
申请号:CN202410923888.X
申请日:2024-07-11
Applicant: 桂林电子科技大学
IPC: G16B15/30 , G16B40/00 , G16B15/00 , G06F18/213 , G06F18/241 , G06F18/25 , G06F18/21 , G06N3/045 , G06N3/042 , G06N3/0464 , G06N3/0499 , G06N3/08
Abstract: 本发明公开了一种多视图图嵌入融合的蛋白质‑DNA结合位点预测方法EGPDI,利用蛋白质结构生成模型AlphaFold2获取蛋白质结构,整合蛋白质序列构成数据集;将蛋白质‑DNA结合位点问题转换为图节点分类问题;使用预训练的蛋白质语言模型(pLMs)生成嵌入和手工设计的特征共同构成图的节点特征编码;基于蛋白质的3D结构信息设计图的边特征编码;采用等变图神经网络和图卷积网络从不同的视图角度捕获信息;使用搭建的EGPDI模型对数据集进行预测,并采用Grid Search超参数优化对模型进行参数优化;采用五折交叉验证的评估方式对模型性能进行评估,使用特异性、精确率、召回率、F1‑score和马修斯相关系数,五个评估指标衡量模型;采用独立测试和案例分析进行模型泛化能力的验证,相比于最先进的方法,EGPDI有了显著的性能提升。
-
公开(公告)号:CN118800331A
公开(公告)日:2024-10-18
申请号:CN202410993153.4
申请日:2024-07-24
Applicant: 桂林电子科技大学
IPC: G16B30/00 , G16B40/00 , G06N3/0442 , G06N3/048 , G06N3/0464 , G06F18/24 , G06N3/049
Abstract: 本发明公开了一种度学习模型结合核苷酸化学性质对于ncRNA家族的预测方法,使用的是公共数据库Rfam中的数据集,利用计算核苷酸化学性质与核苷酸密度的方法NCP‑ND对核苷酸序列数据进行编码,使用多尺度注意力机制(MSA)对初始特征向量进行加权,再使用Bi‑LSTM捕获核苷酸序列的上下文特征,进而使用DenseNet来提取核苷酸序列的全局特征,最后通过全连接网络进行多分类;通过正则化等技术来防止模型过拟合,使用十折交叉验证以及独立测试集来对模型进行性能测试。该方法使用NCP‑ND进行特征编码,不需要生物学的先验知识,利用深度学习的计算方法提高了ncRNA家族预测的准确率。
-
公开(公告)号:CN116403713A
公开(公告)日:2023-07-07
申请号:CN202310308375.3
申请日:2023-03-28
Applicant: 桂林电子科技大学
IPC: G16H50/30 , G06N3/088 , G06F18/2134 , G06F18/2431 , G06F18/21 , G06N3/0464
Abstract: 本发明基于多类无监督特征提取方法对自闭症谱系障风险基因预测的方法,步骤为:获取与自闭症谱系障碍相关基因的正样本、负样本,并从BrainSpan数据库中获取基因的表达值;分别使用自动编码器、主成分分析、奇异值分解和非负矩阵分解四种无监督方法对基因表达值进行特征提取,期间用对数几率回归和五折交叉验证对特征维度的输出进行选择;应用Boruta方法对特征提取后的数据进行特征选择;构建预测模型,输入数据获得初步预测结果;调整训练后预测模型中的参数,对训练后的预测模型进行优化;使用10折交叉验证评估预测模型。实验结果表明,与现有方法相比,我们的结果在各个评估指标都有一定的性能提升,提高了预测与自闭症谱系障相关风险基因的准确率。
-
-
-
-
-
-
-
-
-