-
公开(公告)号:CN110066862B
公开(公告)日:2021-02-12
申请号:CN201910428254.6
申请日:2019-05-22
Applicant: 中南大学
IPC: C12Q1/6869
Abstract: 本发明公开了一种基于高通量测序读数的重复DNA序列识别方法,包括:由高通量测序的读数得到高频k‑mer集合,根据高频k‑mer集合对读数进行筛选,使得包含高频k‑mer较多的读数保留下来,成为高频读数;使用序列组装工具组装高频读数,得到contigs序列;对contigs序列进行筛选,保留下的所有contigs序列即为重复DNA序列。本发明可以从高通量测序读数中识别重复DNA序列,而无需物种参考序列,可以适用于参考序列未知的物种的重复DNA序列识别,并且本发明是通过组装高频读数得到重复DNA序列,相对于组装高频k‑mer得到重复DNA序列,提高了识别重复DNA序列的准确率。
-
公开(公告)号:CN110066862A
公开(公告)日:2019-07-30
申请号:CN201910428254.6
申请日:2019-05-22
Applicant: 中南大学
IPC: C12Q1/6869
Abstract: 本发明公开了一种基于高通量测序读数的重复DNA序列识别方法,包括:由高通量测序的读数得到高频k-mer集合,根据高频k-mer集合对读数进行筛选,使得包含高频k-mer较多的读数保留下来,成为高频读数;使用序列组装工具组装高频读数,得到contigs序列;对contigs序列进行筛选,保留下的所有contigs序列即为重复DNA序列。本发明可以从高通量测序读数中识别重复DNA序列,而无需物种参考序列,可以适用于参考序列未知的物种的重复DNA序列识别,并且本发明是通过组装高频读数得到重复DNA序列,相对于组装高频k-mer得到重复DNA序列,提高了识别重复DNA序列的准确率。
-