-
公开(公告)号:CN116052764A
公开(公告)日:2023-05-02
申请号:CN202211633867.1
申请日:2022-12-19
Applicant: 北京科技大学 , 北京科技大学顺德创新学院
IPC: G16B20/00 , G16B40/30 , G06F18/23213
Abstract: 本发明提供了一种基于超图的染色质域识别方法及系统,该方法包括:获取表观基因组数据;并对数据进行预处理,按照一定碱基对数量对染色质进行片段切割,将每个片段看作基因组一个节点,获取Hi‑C交互作用矩阵;计算各基因组节点由空间交互作用数据和表观基因组数据共同表示的特征向量;对Hi‑C数据矩阵生成初始TADs划分,使用聚类算法根据节点特征对节点进行聚类,调整簇内节点,得到优化后的TADs结构划分。将优化后的TADs划分表示为超图,TADs节点集合作为超边,通过对超图划分识别。将划分后的染色质区域映射到细胞核中探索其生物学意义。本发明适用于生物信息计算领域中染色质域的识别与功能相关研究。
-
公开(公告)号:CN113628112A
公开(公告)日:2021-11-09
申请号:CN202110914432.3
申请日:2021-08-10
Applicant: 北京科技大学 , 北京科技大学顺德研究生院
Abstract: 本发明公开了一种Hi‑C数据分辨率增强方法及装置,所述方法包括:获取原始高分辨率Hi‑C数据和原始高分辨率Hi‑C数据所在细胞系的表观基因组数据;对原始高分辨率Hi‑C数据和表观基因组数据进行预处理,得到原始高分辨率Hi‑C数据对应的Hi‑C数据矩阵和表观基因组数据的相关性矩阵;通过Hi‑C数据矩阵和相关性矩阵对预设的神经网络进行训练,得到分辨率增强模型;基于分辨率增强模型,根据分辨率待增强的Hi‑C数据和对应的表观基因组数据,得到相应的增强后的Hi‑C数据。本发明可以适用于具备多种低分辨率Hi‑C数据和表观基因组数据情况下,实现将低分辨率Hi‑C数据增强至1kb高分辨率。
-
公开(公告)号:CN113628112B
公开(公告)日:2024-07-12
申请号:CN202110914432.3
申请日:2021-08-10
Applicant: 北京科技大学 , 北京科技大学顺德研究生院
Abstract: 本发明公开了一种Hi‑C数据分辨率增强方法及装置,所述方法包括:获取原始高分辨率Hi‑C数据和原始高分辨率Hi‑C数据所在细胞系的表观基因组数据;对原始高分辨率Hi‑C数据和表观基因组数据进行预处理,得到原始高分辨率Hi‑C数据对应的Hi‑C数据矩阵和表观基因组数据的相关性矩阵;通过Hi‑C数据矩阵和相关性矩阵对预设的神经网络进行训练,得到分辨率增强模型;基于分辨率增强模型,根据分辨率待增强的Hi‑C数据和对应的表观基因组数据,得到相应的增强后的Hi‑C数据。本发明可以适用于具备多种低分辨率Hi‑C数据和表观基因组数据情况下,实现将低分辨率Hi‑C数据增强至1kb高分辨率。
-
公开(公告)号:CN114864006A
公开(公告)日:2022-08-05
申请号:CN202210482784.0
申请日:2022-05-05
Applicant: 北京科技大学 , 北京科技大学顺德研究生院
Abstract: 本发明公开了一种Hi‑C数据拓扑相关结构域划分方法及装置,该方法包括:获取Hi‑C基因组测序原始观察数据和用于将原始观察矩阵进行归一化的向量,对原始观察数据预处理,得到归一化的Hi‑C接触矩阵;基于Hi‑C数据接触频率和空间距离之间的关系,将Hi‑C接触矩阵转换为基因组各个位点之间的距离矩阵;通过最短路径算法计算基因组位点间的最短距离,对于每个位点保留距离最小的部分数值得到基因组的空间距离图谱;通过聚类算法对基因组的空间距离图谱中的位点进行聚类,得到Hi‑C数据的TAD划分。本发明通过Hi‑C数据归一化、转换并计算最短路径和基因组位点聚类,实现对染色质TAD的划分。
-
公开(公告)号:CN114385632A
公开(公告)日:2022-04-22
申请号:CN202111567359.3
申请日:2021-12-20
Applicant: 北京科技大学
Abstract: 本发明公开了一种数据对象多维度材料标签自动生成系统,该系统包括多维度特征申请模块、多维度特征审核模块、多维度特征提交模块以及多维度特征预测模块;其中,多维度特征申请模块用于生成申请信息并自动提交;多维度特征预测模块用于通过已有多维度材料标签的数据集对数据的多维度材料标签进行预测;多维度特征审核模块用于对申请信息进行审核;多维度特征提交模块用于将审核通过的带有多维度材料标签的材料数据自动存储。本系统主要服务于材料数据库管理平台和材料数据库平台,也可服务于其他材料相关的数据平台。且本系统涵盖了材料领域数据的多维度特征,可操作性强且易于实现。
-
-
-
-