Как получить геномные координаты из файла fasta
Поскольку произошло обновление эталонного генома, мне нужно было получить fastta из старых последовательностей (из файла постели), чтобы найти новые координаты в этом последнем выпуске.
Итак, из моего файла fastta с именем "my.fasta", (с 35 последовательностями)
Я создал объект "DNAStringSet" после этого:
library ("GenomicRanges")
setwd("/pwd")
pwd <- "my.fasta" #INPUT FILES- BedFiles, FASTA, etc.
path <- system.file("pwd", package = "rGADEM")
FastaFile <- paste(pwd, path, sep = "")
Sequences <- readDNAStringSet(FastaFile, "fasta")
Sequences
A DNAStringSet instance of length 35
width seq names
[1] 300 TTCAGATTGGAGATGGTGAATGA...AACCCTCTGCATAGAATCATAG
[2] 300 GTCTCCCTTCGTGGAGGGGTCAC...TTAACTGAAGATGTTTCCCCGT
И наконец, я попытался использовать rGADEM, чтобы извлечь координаты из моего фаста:
library("rGADEM")
gadem <- GADEM(Sequences, verbose = 1, genome = Ggallus)
startPos(gadem)
Error in x@motifList[[i]] : subscript out of bounds
endPos(gadem)
Error in x@motifList[[i]] : subscript out of bounds
Бутон не работал. Как я могу извлечь координаты из моего файла fasta? Мне нужен IRange, кровать или что-то в этом роде. Спасибо.