基于稳健统计与多策略融合的基因序列变异检测方法
Abstract:
本发明涉及基因变异检测技术领域,具体属于一种基于稳健统计与多策略融合的基因序列变异检测方法,包括:比对生成一个已排序的BAM文件;对数据中的缺失值和N位置进行预处理,采用0填充策略替换缺失值,并移除N位置数据;提取RD信号和MQ信号作为特征值;对提取到的RD信号进行GC偏差矫正;对RD信号和MQ信号进行平滑降噪处理;采取两步递进式分割策略,识别具有高度一致性的RD值的连续片段;构建RD信号和MQ信号的二维剖面,并进行标准化处理;串联重复检测并计算异常分数;利用箱线图方法设置阈值,判定异常值;细化串联重复区域。本发明有效解决了低覆盖度测序数据下串联重复变异检测的难题,显著提高了检测的准确性和可靠性。
Patent Agency Ranking
0/0