Как я могу запросить генетическую базу данных SNP (желательно с R)?

Начиная с нескольких человеческих однонуклеотидных полиморфизмов (SNP), как я могу запросить базу данных всех известных SNPS, чтобы я мог создать список (файл data.table или csv) из 1000 или около того ближайшего SNPS, независимо от того, является ли SNP tagSNP, и какова частота второстепенных аллелей (MAF) и на скольких основаниях она находится вне исходного SNPS?

Я бы предпочел сделать это в R (хотя это не обязательно). Какую базу данных мне использовать? Моей единственной отправной точкой будет перечисление начальных snps (например, rs3091244, rs6311 и т. Д.).

Я уверен, что есть хороший простой пакет Bioconductor, который мог бы стать моей отправной точкой. Но что? Вы когда-нибудь делали это? Я полагаю, что это может быть сделано в 3-5 строк кода.

1 ответ

Опять же, это не по теме, но на самом деле вы можете делать все, что вы упоминаете, через этот веб-инструмент из BROAD:

http://www.broadinstitute.org/mpg/snap/ldsearch.php

Вы просто вводите snp, и это дает вам окружающее окно snps, а также вы можете экспортировать в csv.

Удачи в вашем генетическом проекте!

Другие вопросы по тегам