Редактирование заголовка путем добавления "трубы" в файл fasta

Я хочу редактировать свои заголовки в файле fasta, добавляя каналы, но не могу этого сделать. Заголовок выглядит так

KX035646.1 Имя: домен NADH ATGCGGGGCTGC..

Я хочу это как

зр |KX035646.1| Имя: домен NADH

Номер доступа различен для всех последовательностей. Не могли бы вы мне помочь? Спасибо

1 ответ

Вы можете попробовать простой sed one liner:

cat test.fasta
>KX035646.1 Name:NADH domain ATGCGGGGCTGC..
ACGT
CTTT
>KX035646.2 Name:NADH domain ATGCGGGGCTGC..43214
GCAT

sed 's/^>\([a-zA-Z0-9.]\+\)\(.*\)/>sp|\1|\2/' test.fasta
>sp|KX035646.1| Name:NADH domain ATGCGGGGCTGC..
ACGT
CTTT
>sp|KX035646.2| Name:NADH domain ATGCGGGGCTGC..43214
GCAT
Другие вопросы по тегам