Нет чтения, сопоставленного в правильных парах, в bamfile секвенирования парного конца с использованием samtools
Я работаю с bamfile секвенирования целого генома парного конца и хочу отфильтровать чтения из определенной области генома, которые не отображаются в правильной паре (иногда они указывают на структурный вариант). Я использую samtools и попытался отфильтровать чтения с помощью опции "flag", чтобы выбрать чтения, которые не отображаются в правильной паре. Если я прав, у этих чтений не должно быть 2 в их значении флага. ( https://broadinstitute.github.io/picard/explain-flags.html)
Однако, согласно samtools, ни одно из моих чтений не отображается в правильной паре. Когда я считаю (-c) все операции чтения в указанной мной области без фильтра, это дает мне общее количество 179:
samtools view input.bam "8:113483114-113483213" -c
179
Когда я фильтрую для чтений, которые правильно спарены, то есть флаг содержит "2" (-f 2), счетчик равен нулю:
samtools view input.bam "8:113483114-113483213" -f 2 -c
0
Я проверил, распознаны ли чтения как парные (-f 1), и сопоставлены ли сопряжения (-F 8), и все ли они:
samtools view input.bam "8:113483114-113483213" -f 1 -F 8 -c
179
Я также пытался найти другие области в геноме и везде сталкивался с одной и той же проблемой. Я проверил регионы в IGV, используя те же файлы BAM, и IGV сообщает мне, что большинство операций чтения правильно спарены, а только некоторые - нет. Кто-нибудь знает, что здесь происходит? Были ли файлы BAM помечены таким образом, чтобы не учитывать правильное сопоставление сопряжений?
Любая помощь приветствуется! Большое спасибо.