Описание данных таблиц различий bigQuery в Google genomics
Я хотел бы прочитать все звонки в определенном регионе генома. независимо от генотипа (равен эталонному геному или альтернативному, кодирующему или некодирующему региону). Предполагая, что весь геном был секвенирован. На какую из следующих таблиц я должен смотреть?
Я использую данные геномики Google BigQuery и мне нужно объяснить различия между следующими расширениями файлов: *.genome_calls *.variants *.multisample_variants *.single_sample_genome_calls
Большое спасибо, Эйла
1 ответ
genome_calls - все вызовы генома - не только варианты. могут быть звонки с низким качеством
multisample_variants - варианты по образцам - где каждый вариант будет иметь все образцы, которые содержат эту мутацию в одной строке вариантов
single_sample_genome_calls - варианты по матрице образцов. Варианты, которые существуют в нескольких образцах, будут иметь строку для каждого образца.