Редактирование заголовка путем добавления "трубы" в файл fasta
Я хочу редактировать свои заголовки в файле fasta, добавляя каналы, но не могу этого сделать. Заголовок выглядит так
KX035646.1 Имя: домен NADH ATGCGGGGCTGC..
Я хочу это как
зр |KX035646.1| Имя: домен NADH
Номер доступа различен для всех последовательностей. Не могли бы вы мне помочь? Спасибо
1 ответ
Вы можете попробовать простой sed one liner:
cat test.fasta
>KX035646.1 Name:NADH domain ATGCGGGGCTGC..
ACGT
CTTT
>KX035646.2 Name:NADH domain ATGCGGGGCTGC..43214
GCAT
sed 's/^>\([a-zA-Z0-9.]\+\)\(.*\)/>sp|\1|\2/' test.fasta
>sp|KX035646.1| Name:NADH domain ATGCGGGGCTGC..
ACGT
CTTT
>sp|KX035646.2| Name:NADH domain ATGCGGGGCTGC..43214
GCAT