Описание тега fasta
FASTA - это программный пакет для выравнивания последовательностей белков и нуклеиновых кислот. FASTA - это также название формата файла, используемого этими программами для представления последовательностей пептидов или нуклеотидов. Формат де-факто является стандартом в биоинформатике.
Формат FASTA (читается как "быстрый формат A") - это текстовый формат, используемый программным обеспечением FASTA для представления нуклеиновых кислот и белков. Он представляет каждый нуклеотид и аминокислоту в виде буквы. Формат FASTA также поддерживает именование последовательностей.
Формат приобрел большую популярность, став де-факто стандартом для представления биологических последовательностей.
Биоинформатическая запись в формате FASTA состоит из строки заголовка (комментария), за которой следует одна или несколько строк, описывающих последовательность (одна буква на нуклеотид или аминокислоту). Строки заголовка начинаются с>
. Последующая последовательность имеет фиксированную ширину (часто 60, но обычно не более 80).
> Sample nucleotide sequence
AGCACTGAGTAACGTATAAGCAGTCCCCGGACGCGTA
> Nucleotide sequence #2
GCCACGGGAGTTGAAGAACATCGAGAATGCCACTAGTTTTCACCCTTCATAGATATCCTA
GCGCCGTACATGTATACGAGATCTTTGTCACGCAGTATGGAGGATTGTGGCCAGCAATAC
GTCGTGTCCCGCAATGCTTCATTAGATCCCCGTATATCCATCCTGAGTCATTGTCTGTTG
TCCGTTTTGAAGGAGTCTAGCAGCTTGATA