Как получить геномные координаты из файла fasta

Поскольку произошло обновление эталонного генома, мне нужно было получить fastta из старых последовательностей (из файла постели), чтобы найти новые координаты в этом последнем выпуске.

Итак, из моего файла fastta с именем "my.fasta", (с 35 последовательностями)

Я создал объект "DNAStringSet" после этого:

 library ("GenomicRanges")
 setwd("/pwd")
 pwd  <- "my.fasta" #INPUT FILES- BedFiles, FASTA, etc.
 path <- system.file("pwd", package = "rGADEM")
 FastaFile <- paste(pwd, path, sep = "")
 Sequences <- readDNAStringSet(FastaFile, "fasta")
 Sequences

 A DNAStringSet instance of length 35
     width seq                                              names
 [1]   300 TTCAGATTGGAGATGGTGAATGA...AACCCTCTGCATAGAATCATAG
 [2]   300 GTCTCCCTTCGTGGAGGGGTCAC...TTAACTGAAGATGTTTCCCCGT

И наконец, я попытался использовать rGADEM, чтобы извлечь координаты из моего фаста:

library("rGADEM")
gadem <- GADEM(Sequences, verbose = 1, genome = Ggallus)

startPos(gadem)
Error in x@motifList[[i]] : subscript out of bounds
endPos(gadem)
Error in x@motifList[[i]] : subscript out of bounds

Бутон не работал. Как я могу извлечь координаты из моего файла fasta? Мне нужен IRange, кровать или что-то в этом роде. Спасибо.

0 ответов

Другие вопросы по тегам