Описание данных таблиц различий bigQuery в Google genomics

Я хотел бы прочитать все звонки в определенном регионе генома. независимо от генотипа (равен эталонному геному или альтернативному, кодирующему или некодирующему региону). Предполагая, что весь геном был секвенирован. На какую из следующих таблиц я должен смотреть?

Я использую данные геномики Google BigQuery и мне нужно объяснить различия между следующими расширениями файлов: *.genome_calls *.variants *.multisample_variants *.single_sample_genome_calls

Большое спасибо, Эйла

1 ответ

genome_calls - все вызовы генома - не только варианты. могут быть звонки с низким качеством

multisample_variants - варианты по образцам - где каждый вариант будет иметь все образцы, которые содержат эту мутацию в одной строке вариантов

single_sample_genome_calls - варианты по матрице образцов. Варианты, которые существуют в нескольких образцах, будут иметь строку для каждого образца.

Другие вопросы по тегам