Как я могу запросить генетическую базу данных SNP (желательно с R)?
Начиная с нескольких человеческих однонуклеотидных полиморфизмов (SNP), как я могу запросить базу данных всех известных SNPS, чтобы я мог создать список (файл data.table или csv) из 1000 или около того ближайшего SNPS, независимо от того, является ли SNP tagSNP, и какова частота второстепенных аллелей (MAF) и на скольких основаниях она находится вне исходного SNPS?
Я бы предпочел сделать это в R (хотя это не обязательно). Какую базу данных мне использовать? Моей единственной отправной точкой будет перечисление начальных snps (например, rs3091244, rs6311 и т. Д.).
Я уверен, что есть хороший простой пакет Bioconductor, который мог бы стать моей отправной точкой. Но что? Вы когда-нибудь делали это? Я полагаю, что это может быть сделано в 3-5 строк кода.
1 ответ
Опять же, это не по теме, но на самом деле вы можете делать все, что вы упоминаете, через этот веб-инструмент из BROAD:
http://www.broadinstitute.org/mpg/snap/ldsearch.php
Вы просто вводите snp, и это дает вам окружающее окно snps, а также вы можете экспортировать в csv.
Удачи в вашем генетическом проекте!