-
公开(公告)号:CN108897986A
公开(公告)日:2018-11-27
申请号:CN201810530874.6
申请日:2018-05-29
Applicant: 中南大学
Abstract: 本发明公开了一种基于蛋白质信息的基因组序列拼接方法,包括:获取待拼接的DNA序列与蛋白质序列之间的比对信息;确定每条蛋白质序列上对应的DNA序列之间的相邻关系;构建相邻DNA序列之间的连接边并获取每个蛋白质序列上对应的每个DNA序列连接边的支持信息;依次对每个DNA序列连接边的支持信息进行去噪处理;基于权重打分函数依次对每个DNA序列的前、后节点进行去噪处理;计算存在支持信息的所有DNA序列连接边的连接间距;基于所有DNA序列连接边的连接间距以及每个DNA序列的前、后节点依次串接得到基因组序列拼接路径。通过上述方法提高基因组序列拼接结果的敏感性和精确度。
-
公开(公告)号:CN108897986B
公开(公告)日:2020-11-27
申请号:CN201810530874.6
申请日:2018-05-29
Applicant: 中南大学
Abstract: 本发明公开了一种基于蛋白质信息的基因组序列拼接方法,包括:获取待拼接的DNA序列与蛋白质序列之间的比对信息;确定每条蛋白质序列上对应的DNA序列之间的相邻关系;构建相邻DNA序列之间的连接边并获取每个蛋白质序列上对应的每个DNA序列连接边的支持信息;依次对每个DNA序列连接边的支持信息进行去噪处理;基于权重打分函数依次对每个DNA序列的前、后节点进行去噪处理;计算存在支持信息的所有DNA序列连接边的连接间距;基于所有DNA序列连接边的连接间距以及每个DNA序列的前、后节点依次串接得到基因组序列拼接路径。通过上述方法提高基因组序列拼接结果的敏感性和精确度。
-