-
公开(公告)号:CN118692557A
公开(公告)日:2024-09-24
申请号:CN202410892280.5
申请日:2024-07-04
Applicant: 东北林业大学
Abstract: 一种基于图神经网络的药物靶点亲和力预测方法,涉及一种药物靶点亲和力预测方法。为了解决现有方法存在药物靶点亲和力预测精度低的问题。本发明从药物原子图中学习药物全局特征;对正例蛋白质疏水图、正例蛋白质氢键图、正例蛋白质接触图提取氨基酸正例特征,进行融合池化得到氨基酸正例融合池化特征作为蛋白质全局特征;对药物原子图抽取子图得到药物子图特征作为药物局部信息;对正例蛋白质疏水图、正例蛋白质氢键图、正例蛋白质接触图抽取子图,得到蛋白质子图特征作为蛋白质局部信息。药物局部特征和药物全局特征拼接为药物特征,蛋白质局部特征和蛋白质全局特征拼接为蛋白质特征,二者拼接为药物‑蛋白质联合特征,用于药物靶点亲和力预测。
-
公开(公告)号:CN118629507A
公开(公告)日:2024-09-10
申请号:CN202410670842.1
申请日:2024-05-28
Applicant: 东北林业大学
IPC: G16B40/00 , G16B30/10 , G06N3/0455 , G06N3/08 , G06F17/16
Abstract: 基于域分离网络的lncRNA m6A甲基化位点预测网络模型确定方法及预测方法,属于生物信息技术领域。本发明分别使用One‑Hot、核苷酸理化性质与频率、位置特异性k‑mer倾向三种编码方法进行序列编码,通过三个同构的网络,分别提取源域mRNA的私有特征、目标域lncRNA的私有特征,以及来自二者的共享特征;基于这些特征进行模型的训练,训练过程中,控制源域和目标域的共享特征的相似性损失获取到高质量共享特征,控制私有特征和共享特征的差异损失将二者分离,控制重构特征与原始特征的损失减少特征丢失。最后提取训练好三个同构的网络中的共享特征提取网络再连接一个分类器,得到用于lncRNA m6A甲基化位点预测的网络模型。
-
公开(公告)号:CN117012382B
公开(公告)日:2024-08-23
申请号:CN202310581700.3
申请日:2023-05-22
Applicant: 东北林业大学
IPC: G16H50/30 , G16B40/00 , G06F18/22 , G06F18/214 , G06F18/243 , G06F18/25 , G06N3/0464 , G06N3/08
Abstract: 基于深度特征融合的疾病相关circRNA预测系统,本发明涉及疾病相关circRNA预测系统。本发明的目的是为了解决现有基于机器学习的方法只是将circRNA和disease的特征分别处理后进行简单的拼接,只关注网络中相邻结点的特征和本身的特征,没有将disease的特征信息与circRNA的特征信息进行整合,导致disease的特征与circRNA特征中的有效信息没有得到充分利用,对disease与circRNA的关联性预测准确率低的问题。系统包括:circRNA‑disease之间的关联关系获取模块、矩阵获取模块、circRNA整合相似性矩阵获取模块、disease整合相似性矩阵获取模块、局部特征提取模块、circRNA的全局特征提取模块、disease的全局特征提取模块、disease特征获取模块、circRNA特征获取模块、disease与circRNA的关联预测模块、待测模块。本发明用于生物信息领域。
-
公开(公告)号:CN117524346B
公开(公告)日:2024-07-05
申请号:CN202311547057.9
申请日:2023-11-20
Applicant: 东北林业大学
Abstract: 一种多视图癌症药物反应预测系统,涉及生物信息技术领域,本申请采用多视图的策略代替了通过GCN在细胞系‑药物异质图上聚合已知反应信息的传统方法,充分利用了已知的细胞系‑药物的所有反应信息。引入ILGCN,在一定程度上缓解了高阶GCN出现的过平滑问题。这使得本发明在提高预测性能的同时,也提供了更稳定和可靠的结果。在GDSC和CCLE两个数据集上进行大量实验,验证了本申请在不同实验设置下优于当前最先进的几个CDR预测方法。具有较好的鲁棒性和泛化性。本申请预测方法充分利用已知细胞系和药物数据,因此本申请的技术方案提升了癌症药物反应预测准确率。
-
公开(公告)号:CN116070157B
公开(公告)日:2024-04-16
申请号:CN202310041103.1
申请日:2023-01-13
Applicant: 东北林业大学
IPC: G06F18/2415 , G06F18/214 , G06F18/2431 , G06F18/25 , G16B30/00
Abstract: 基于级联森林和双流结构的circRNA识别方法,具体涉及一种利用级联森林基于RNA序列k‑mer生物特征和circRNA剪接位置特征的双流结构的circRNA识别方法,为了解决现有circRNA识别方法识别的结果不准确的问题。获取预处理后包含circRNA或lncRNA的RNA序列,获得每条RNA序列剪接位置序列的位置特征向量,以及RNA序列k‑mer信息的k‑mer特征向量,将二者分别输入位置森林和k‑mer森林中,分别输出位置类别概率向量和k‑mer类别概率向量,将位置类别概率向量和k‑mer类别概率向量分别与超参数u进行融合,将融合后的两个结果相加,得到RNA序列最终的类别概率向量,获得RNA序列是否为circRNA的识别结果。属于生物信息领域。
-
公开(公告)号:CN117524346A
公开(公告)日:2024-02-06
申请号:CN202311547057.9
申请日:2023-11-20
Applicant: 东北林业大学
Abstract: 一种多视图癌症药物反应预测系统,涉及生物信息技术领域,本申请采用多视图的策略代替了通过GCN在细胞系‑药物异质图上聚合已知反应信息的传统方法,充分利用了已知的细胞系‑药物的所有反应信息。引入ILGCN,在一定程度上缓解了高阶GCN出现的过平滑问题。这使得本发明在提高预测性能的同时,也提供了更稳定和可靠的结果。在GDSC和CCLE两个数据集上进行大量实验,验证了本申请在不同实验设置下优于当前最先进的几个CDR预测方法。具有较好的鲁棒性和泛化性。本申请预测方法充分利用已知细胞系和药物数据,因此本申请的技术方案提升了癌症药物反应预测准确率。
-
公开(公告)号:CN116070157A
公开(公告)日:2023-05-05
申请号:CN202310041103.1
申请日:2023-01-13
Applicant: 东北林业大学
IPC: G06F18/2415 , G06F18/214 , G06F18/2431 , G06F18/25 , G16B30/00
Abstract: 基于级联森林和双流结构的circRNA识别方法,具体涉及一种利用级联森林基于RNA序列k‑mer生物特征和circRNA剪接位置特征的双流结构的circRNA识别方法,为了解决现有circRNA识别方法识别的结果不准确的问题。获取预处理后包含circRNA或lncRNA的RNA序列,获得每条RNA序列剪接位置序列的位置特征向量,以及RNA序列k‑mer信息的k‑mer特征向量,将二者分别输入位置森林和k‑mer森林中,分别输出位置类别概率向量和k‑mer类别概率向量,将位置类别概率向量和k‑mer类别概率向量分别与超参数u进行融合,将融合后的两个结果相加,得到RNA序列最终的类别概率向量,获得RNA序列是否为circRNA的识别结果。属于生物信息领域。
-
-
-
-
-
-