Описание тега fasta
FASTA - это программный пакет для выравнивания последовательностей белков и нуклеиновых кислот. FASTA - это также название формата файла, используемого этими программами для представления последовательностей пептидов или нуклеотидов. Формат де-факто является стандартом в биоинформатике.
2
ответа
Присвоение поиска регулярного выражения переменной: ошибка неинициализированной переменной
Я открываю файлы в каталоге, который содержит две строки последовательностей в каждом файле. Верхняя последовательность длиннее нижней, но включает нижнюю последовательность. Я хотел бы расширить нижнюю последовательность двумя боковыми буквами в ка…
11 авг '16 в 19:28
3
ответа
Соберите слово в одном файле и используйте это слово для сопоставления в файле FASTA, добавив последовательность FASTA в первый файл
Я хочу grep несколько слов в file1, и использовать каждое слово, чтобы grep, что следует после его соответствия в file2.fasta. И затем я хочу добавить элемент, который последовал за совпадением, к слову, которое я использовал, в file03, чтобы file03…
13 июн '13 в 15:55
1
ответ
Редактирование заголовка путем добавления "трубы" в файл fasta
Я хочу редактировать свои заголовки в файле fasta, добавляя каналы, но не могу этого сделать. Заголовок выглядит так KX035646.1 Имя: домен NADH ATGCGGGGCTGC.. Я хочу это как зр |KX035646.1| Имя: домен NADH Номер доступа различен для всех последовате…
12 фев '18 в 12:43
1
ответ
Python. Попытка сортировки файла для 3 самых длинных нуклеотидных последовательностей гена из файла genbank в файл fasta с использованием BioPython
Я относительно новичок в Python, поэтому, пожалуйста, прости идиотизм, который идет с этим вопросом. У меня есть файл genbank и я написал фрагмент кода, который возьмет 3 самых длинных гена и поместит их во вновь сгенерированный файл fasta. from Bio…
02 мар '14 в 20:35
1
ответ
Дублируй FASTA, сохраняй seq id
Мне нужно отформатировать файлы для инструмента идентификации miRNA (miREAP). У меня есть файл fasta в следующем формате: >seqID_1 CCCGGCCGTCGAGGC >seqID_2 AGGGCACGCCTGCCTGGGCGTCACGC >seqID_3 CCGCATCAGGTCTCCAAGGTGAACAGCCTCTGGTCGA >seqID_…
23 июл '15 в 19:09
2
ответа
Посчитать число 20-ти в фасте по питону
Обычный файл fasta с длиной чтения 120 nt: 'single_mapped.fa' CSV-файл содержит 10000 20-метровых данных и число для каждого 20-метрового файла: "20frequent_20mers.txt", например: AAAAAGTATAGGAGATAGAA 35 AAAAATAGGAGGACTATTCA 26 AAAAATAGGAGGACTATTTA …
15 май '18 в 14:10
1
ответ
Исключить последовательности в зависимости от идентификатора описания в AWK
У меня есть файлы fasta, которые имеют некоторый идентификатор описания ( isoforms 2, ... Isoform 9), я хочу исключить их в файлах fasta. Я использовал эту командную строку, чтобы увидеть, какой файл содержит ID изоформы от 2 до 9: for i in `ls *.fa…
25 сен '17 в 14:47
1
ответ
Разделение заголовка и содержимого с помощью регулярных выражений
У меня есть следующий текст последовательности в файле каждый заголовок начинается с ">", количество строк случайное >XM_024446048.1 PREDICTED: Homo sapiens mannosidase alpha class 2A member 1 (MAN2A1), transcript variant X2, mRNA CAGCCCCC TGAGCG…
14 фев '19 в 15:30
2
ответа
Подсчет последовательностей в файле, начинающихся и заканчивающихся пользовательским соответствием
У меня есть файл с последовательностями ДНК в формате fastta под названием "test.fas": >test1 GCCATTACAGAACATCAGTCACAGTACGTACTGTGTTCTGCCGTGCTGTCTA >test2 CGGATGAAGCGCCAATCGTACGTACAATAAGTTGCCTAAAGTGTTTCA >test3 ATGCATGCATGC У меня также есть…
20 апр '18 в 16:29
3
ответа
Конвертация из тсв в фасту
У меня есть куча файлов TSV в моей папке, и для каждого из них я хотел бы получить файл фаста, где заголовок после знака ">" - это имя файла. Мой файл TSV имеет 5 столбцов без заголовка: Таким образом: входной файл называется: "A.coseq.table_headles…
14 июн '17 в 18:53
1
ответ
Как получить перекрывающиеся шаблоны с помощью Python Finditer?
Я использую скрипт Python, который ищет шаблон в файле FASTA. Он работает очень хорошо, но не возвращает перекрывающихся строк. К сожалению, меня интересуют потенциальные перекрывающиеся строки. Поскольку я не программист (я просто пытаюсь изучать P…
11 апр '14 в 16:03
1
ответ
Разбор описания файла Fasta с использованием biopython
У меня есть файл fasta (первая последовательность упоминается ниже) с длинным описанием. Мне нужно выбрать конкретные поля описания. когда я использовал следующий код; все описание попасть в строку. from Bio import SeqIO for record in SeqIO.parse("g…
16 сен '11 в 07:20
2
ответа
Биопайт не запускается
Поэтому я пытался работать с Biopython, и я довольно новый. Мой код: fasta_string = open("C:\\Users\\saeed\\Desktop\\dna2.fasta").read() print('1') result_handle = NCBIWWW.qblast("blastn", "nt", fasta_string) print('2') blast_record = NCBIXML.read(r…
04 июн '17 в 20:01
1
ответ
Python: сравнение двух файлов мульти-фаста одного и того же набора белков с парсером - для поиска и подсчета мутаций после обработки
Моя задача - подсчитать мутации, произошедшие в нескольких белках после лечения. Все последовательности присутствуют в двух файлах в одном и том же порядке. Я открыл оба файла с помощью анализатора fasta (SeqIO.parse) в biopython и получил все переч…
31 янв '18 в 16:14
1
ответ
Как я могу получить правильный счет для точных совпадений FASTA?
Я должен искать шаблон wTTTAYRTTTW, где W знак равно A или же T, Y знак равно C или же T, R знак равно A или же R, в файле FASTA последовательности генома. Должно быть разрешено некоторое несоответствие, то есть строка с точным соответствием и их по…
20 июн '12 в 12:22
1
ответ
Конвертировать molfile в fasta
Я работаю над проектом биоинформатики. Я хочу конвертировать файл MDL (molfile - .mol) в файл FASTA, используя python. Может кто-нибудь сказать мне, как я могу сделать то же самое? структура файла mol: http://en.wikipedia.org/wiki/Chemical_table_fil…
07 фев '13 в 05:27
1
ответ
Фаста чтение файла Python
Я читаю файл FASTA, который имеет такой формат: > Г |31563518| исй |NP_852610.1| ассоциированные с микротрубочками белки 1A/1B легкой цепи 3A изоформы b [Homo sapiens] MKMRFFSSPCGKAAVDPADRCKEVQQIRDQHPSKIPVIIERYKGEKQLPVLDKTKFLVPDHVNMSELVKIIRRRLQLNPTQ…
12 ноя '14 в 04:18
1
ответ
Замените FASTA seq_ID новым идентификатором из dict, используя BioPython
У меня есть большой файл с множеством последовательностей FASTA. Некоторые из них необходимо переименовать - я пытаюсь заменить идентификаторы последовательности FASTA на их обновленную версию. Я сохранил информацию в словаре таким образом, что стар…
13 авг '18 в 23:32
2
ответа
Повторное написание в выводе с использованием списка символов - python
В файле у меня есть несколько символов для замены. буквы = ["B", "Z", "J", "U", "O"] for record in SeqIO.parse(inFile, "fasta"): for letter in letters: if letters in str(record.seq): print record.id record.seq = str(record.seq).replace(letter, "X") …
09 окт '18 в 08:47
1
ответ
Написать таблицу в "для цикла" (R)
У меня есть много последовательностей в текстовом файле. Я импортирую эти последовательности, используя функцию "read.fasta". Я использую "for loop", чтобы создать таблицу частоты нуклеотидов для каждой последовательности, и использую "write.table",…
28 июл '13 в 12:04