-
公开(公告)号:CN116070157B
公开(公告)日:2024-04-16
申请号:CN202310041103.1
申请日:2023-01-13
Applicant: 东北林业大学
IPC: G06F18/2415 , G06F18/214 , G06F18/2431 , G06F18/25 , G16B30/00
Abstract: 基于级联森林和双流结构的circRNA识别方法,具体涉及一种利用级联森林基于RNA序列k‑mer生物特征和circRNA剪接位置特征的双流结构的circRNA识别方法,为了解决现有circRNA识别方法识别的结果不准确的问题。获取预处理后包含circRNA或lncRNA的RNA序列,获得每条RNA序列剪接位置序列的位置特征向量,以及RNA序列k‑mer信息的k‑mer特征向量,将二者分别输入位置森林和k‑mer森林中,分别输出位置类别概率向量和k‑mer类别概率向量,将位置类别概率向量和k‑mer类别概率向量分别与超参数u进行融合,将融合后的两个结果相加,得到RNA序列最终的类别概率向量,获得RNA序列是否为circRNA的识别结果。属于生物信息领域。
-
公开(公告)号:CN116070157A
公开(公告)日:2023-05-05
申请号:CN202310041103.1
申请日:2023-01-13
Applicant: 东北林业大学
IPC: G06F18/2415 , G06F18/214 , G06F18/2431 , G06F18/25 , G16B30/00
Abstract: 基于级联森林和双流结构的circRNA识别方法,具体涉及一种利用级联森林基于RNA序列k‑mer生物特征和circRNA剪接位置特征的双流结构的circRNA识别方法,为了解决现有circRNA识别方法识别的结果不准确的问题。获取预处理后包含circRNA或lncRNA的RNA序列,获得每条RNA序列剪接位置序列的位置特征向量,以及RNA序列k‑mer信息的k‑mer特征向量,将二者分别输入位置森林和k‑mer森林中,分别输出位置类别概率向量和k‑mer类别概率向量,将位置类别概率向量和k‑mer类别概率向量分别与超参数u进行融合,将融合后的两个结果相加,得到RNA序列最终的类别概率向量,获得RNA序列是否为circRNA的识别结果。属于生物信息领域。
-