-
公开(公告)号:CN116701710A
公开(公告)日:2023-09-05
申请号:CN202310764315.2
申请日:2023-06-27
Applicant: 北京科技大学顺德创新学院
IPC: G06F16/835 , G06F16/9035 , G06N3/04 , G06N3/08
Abstract: 本发明涉及数据库应用领域,具体的说是半结构化文档数据模式实时推荐方法,包括以下步骤:步骤S1:半结构化文档数据模式嵌入,将半结构化文档数据模式转化为低维的向量表示,并作为实时推荐的输入,步骤S2:实时推荐,根据用户正在创建的数据模式内容以及当前输入字段,预测用户接下来将要创建的内容并进行推荐,帮助用户快速创建高质量的数据模式。可减少用户创建数据模式的三分之二操作次数,大大减轻用户创建数据模式的负担,同时引导用户使用同质的数据模式,降低数据库数据模式的异构型,提升数据利用效率。
-
公开(公告)号:CN116052764A
公开(公告)日:2023-05-02
申请号:CN202211633867.1
申请日:2022-12-19
Applicant: 北京科技大学 , 北京科技大学顺德创新学院
IPC: G16B20/00 , G16B40/30 , G06F18/23213
Abstract: 本发明提供了一种基于超图的染色质域识别方法及系统,该方法包括:获取表观基因组数据;并对数据进行预处理,按照一定碱基对数量对染色质进行片段切割,将每个片段看作基因组一个节点,获取Hi‑C交互作用矩阵;计算各基因组节点由空间交互作用数据和表观基因组数据共同表示的特征向量;对Hi‑C数据矩阵生成初始TADs划分,使用聚类算法根据节点特征对节点进行聚类,调整簇内节点,得到优化后的TADs结构划分。将优化后的TADs划分表示为超图,TADs节点集合作为超边,通过对超图划分识别。将划分后的染色质区域映射到细胞核中探索其生物学意义。本发明适用于生物信息计算领域中染色质域的识别与功能相关研究。
-
公开(公告)号:CN117766027A
公开(公告)日:2024-03-26
申请号:CN202311836407.3
申请日:2023-12-28
Applicant: 北京科技大学 , 北京科技大学顺德创新学院
IPC: G16B30/00 , G16B40/00 , G06N3/042 , G06N3/0499 , G06N3/08
Abstract: 本发明公开了一种DNA序列增强子‑启动子交互作用识别方法及装置,属于医学工程技术领域。所述方法包括:获取细胞系对应的增强子‑启动子交互作用数据集;将数据集中的DNA序列对输入到预先训练好的自然语言模型中,获得每个DNA序列的词嵌入编码;利用获取的词嵌入编码构建图结构数据;利用图结构数据对图神经网络模型进行训练,获得训练好的图神经网络模型;获取待预测DNA序列对并输入到预先训练好的自然语言模型中,获得每个待预测DNA序列的词嵌入编码;根据预测的词嵌入编码构建图结构数据;将待预测图结构数据输入训练好的图神经网络模型中,获得DNA序列对中增强子‑启动子交互作用识别结果。采用本发明,可以提高增强子‑启动子交互作用识别准确率。
-
公开(公告)号:CN117766027B
公开(公告)日:2024-06-18
申请号:CN202311836407.3
申请日:2023-12-28
Applicant: 北京科技大学 , 北京科技大学顺德创新学院
IPC: G16B30/00 , G16B40/00 , G06N3/042 , G06N3/0499 , G06N3/08
Abstract: 本发明公开了一种DNA序列增强子‑启动子交互作用识别方法及装置,属于医学工程技术领域。所述方法包括:获取细胞系对应的增强子‑启动子交互作用数据集;将数据集中的DNA序列对输入到预先训练好的自然语言模型中,获得每个DNA序列的词嵌入编码;利用获取的词嵌入编码构建图结构数据;利用图结构数据对图神经网络模型进行训练,获得训练好的图神经网络模型;获取待预测DNA序列对并输入到预先训练好的自然语言模型中,获得每个待预测DNA序列的词嵌入编码;根据预测的词嵌入编码构建图结构数据;将待预测图结构数据输入训练好的图神经网络模型中,获得DNA序列对中增强子‑启动子交互作用识别结果。采用本发明,可以提高增强子‑启动子交互作用识别准确率。
-
-
-