Ошибка R при подключении к NCBI для доступа к белковым последовательностям с использованием "read.GenBank"

Я пытаюсь получить доступ к данным последовательности белка из NCBI в R, используя функцию read.Genbank:

например

ref.proteins <- c("XP_005327622", "XP_026241994", "NP_001107354", " XP_007536378", 
                  "NP_001268234 XP_004712197", "XP_017531808", "PBC34963","BAN21060",
                  "XP_011342207","ACD03812", "XP_009644718", "XP_023982408",
                  "XP_023982408", "XP_006082035", "BAX24454", "XP_026490557",
                  "AAS10175", "BAO58576", "AAM49148") 

read.GenBank("ref.proteins")

но я продолжаю получать эту ошибку:

Ошибка в файле (файл, "r"): не удается открыть соединение с " https://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=nucleotide&id=ref.proteins&rettype=fasta&retmode=text "Кроме того: Предупреждение: в файле (файл," r "): невозможно открыть URL" https://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=nucleotide&id=ref.proteins&rettype=fasta&retmode=text ': HTTP-статус был "400 неверных запросов"

кто-нибудь может помочь? Как исправить проблему с подключением? Из того, что я читал в Интернете, кажется, проблема в Mac OS? Спасибо

1 ответ

Вам нужно бросить цитаты вокруг ref.proteins во второй строке. Это работает:

ref.proteins <- c("XP_005327622", "XP_026241994", "NP_001107354", " XP_007536378")
read.GenBank(ref.proteins)

Вы можете скачать белковые последовательности в файле fasta, используя refseqR пак.

#Dependencies
library(refseqR)

ref.proteins <- c("XP_005327622", "XP_026241994", "NP_001107354", "XP_007536378")

save_AAfasta_from_xps(ref.proteins, "Downloads/my_proteins")
Другие вопросы по тегам