一种基于高通量测序读数的重复DNA序列识别方法

    公开(公告)号:CN110066862B

    公开(公告)日:2021-02-12

    申请号:CN201910428254.6

    申请日:2019-05-22

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于高通量测序读数的重复DNA序列识别方法,包括:由高通量测序的读数得到高频k‑mer集合,根据高频k‑mer集合对读数进行筛选,使得包含高频k‑mer较多的读数保留下来,成为高频读数;使用序列组装工具组装高频读数,得到contigs序列;对contigs序列进行筛选,保留下的所有contigs序列即为重复DNA序列。本发明可以从高通量测序读数中识别重复DNA序列,而无需物种参考序列,可以适用于参考序列未知的物种的重复DNA序列识别,并且本发明是通过组装高频读数得到重复DNA序列,相对于组装高频k‑mer得到重复DNA序列,提高了识别重复DNA序列的准确率。

    一种基于高通量测序读数的重复DNA序列识别方法

    公开(公告)号:CN110066862A

    公开(公告)日:2019-07-30

    申请号:CN201910428254.6

    申请日:2019-05-22

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于高通量测序读数的重复DNA序列识别方法,包括:由高通量测序的读数得到高频k-mer集合,根据高频k-mer集合对读数进行筛选,使得包含高频k-mer较多的读数保留下来,成为高频读数;使用序列组装工具组装高频读数,得到contigs序列;对contigs序列进行筛选,保留下的所有contigs序列即为重复DNA序列。本发明可以从高通量测序读数中识别重复DNA序列,而无需物种参考序列,可以适用于参考序列未知的物种的重复DNA序列识别,并且本发明是通过组装高频读数得到重复DNA序列,相对于组装高频k-mer得到重复DNA序列,提高了识别重复DNA序列的准确率。

Patent Agency Ranking