Описание тега genbank
Формат GenBank (GenBank Flat File Format) состоит из раздела аннотации и раздела последовательности. Начало раздела аннотации отмечается строкой, начинающейся со слова "LOCUS".
1
ответ
Python. Попытка сортировки файла для 3 самых длинных нуклеотидных последовательностей гена из файла genbank в файл fasta с использованием BioPython
Я относительно новичок в Python, поэтому, пожалуйста, прости идиотизм, который идет с этим вопросом. У меня есть файл genbank и я написал фрагмент кода, который возьмет 3 самых длинных гена и поместит их во вновь сгенерированный файл fasta. from Bio…
02 мар '14 в 20:35
1
ответ
Запрос Genbank (пакет seqinr): поиск в описании последовательности
Я использую функцию query() пакета seqinr загрузить последовательности ДНК миоглобина из Genbank. Например: query("myoglobins","K=myoglobin AND SP=Turdus merula") К сожалению, для многих видов, которые я ищу, я не получаю никакой последовательности …
15 июл '13 в 16:14
3
ответа
Неполный анализ всего файла genbank с использованием python/biopython
Основная цель моего сценария - преобразовать файл genbank в файл gtf. Моя проблема связана с извлечением информации CDS (ген, позиция (например, CDS 2598105..2598404), codon_start, protein_id, db_xref) из всех записей CDS. Мой скрипт должен открыват…
17 дек '15 в 17:19
1
ответ
Извлекать метаданные из геномных файлов gbff
У меня есть>1000 .gbff.gz геномных файлов, и я хочу извлечь метаданные из каждого и иметь записи метаданных в отдельных столбцах.
28 сен '17 в 03:24
2
ответа
Разбор файла GenBank: получить тег locus против продукта
По сути, файл GenBank состоит из записей генов (объявляемых 'gene', за которыми следует соответствующая запись 'CDS' (только по одной на ген), подобно двум, которые я здесь показываю ниже. Я хотел бы получить locus_tag против продукта в символе с ра…
27 фев '14 в 11:55
0
ответов
Перебирая страницы в многостраничных результатах Genbank
Пример: http://www.ncbi.nlm.nih.gov/nuccore/?term=trocholejeunea в котором 79 страниц на 4 страницах, однако, когда я просматривал страницы, нажимая "Предыдущий" или "Далее", адрес превращается в http://www.ncbi.nlm.nih.gov/nuccore/ Он не работает, …
12 ноя '17 в 18:26
1
ответ
Пожалуйста, помогите мне прочитать файл genbank с диска и преобразовать его в fastta
Пожалуйста, помогите мне преобразовать последовательность GenBank в эквивалентный ей формат FASTA, используя biosmalltalk (издание Pharo). Я уже разобрался, чтобы прочитать файл GenBank с диска: | файл x y m | x:= время миллисекунды ClockValue . fil…
26 сен '14 в 09:53
3
ответа
Изменить местоположение функции генбанка
Редактировать : я знаю feature.type даст ген /CDS и feature.qualifiers затем даст "db_xref"/"locus_tag"/"вывод" и т. д. Есть ли feature. объект, который позволит мне получить доступ к местоположению (например: [5240:7267](+)) прямо? Этот URL дает не…
08 июл '14 в 16:04
3
ответа
Конвертировать ФАСТА в ГенБанк
Есть ли способ использовать BioPython для преобразования файлов FASTA в формат Genbank? Есть много ответов о том, как конвертировать Genbank в FASTA, но не наоборот.
12 май '15 в 03:59
1
ответ
Entrez и SeqIO "не найдено записей в дескрипторе"
Мой код выглядит так: import re from Bio import SeqIO from Bio import Entrez Entrez.email = "...@..." # My e-mail address handle1 = Entrez.efetch(db="pubmed", id=pmid_list_2010, rettype="gb", retmode="text") data1 = handle1.read() handle1.close() ha…
19 апр '16 в 07:00
1
ответ
Улучшение функции Genbank
Я пытаюсь добавить более 70000 новых функций в файл genbank с помощью biopython. У меня есть этот код: from Bio import SeqIO from Bio.SeqFeature import SeqFeature, FeatureLocation fi = "myoriginal.gbk" fo = "mynewfile.gbk" for result in results: sta…
08 июл '15 в 11:09
0
ответов
Фильтровать файлы genbank по порядку видов в R
Создавая локальную базу данных из файлов генбанка 456 последовательностей генов FOXP2 млекопитающих, эти последовательности оторвались от взрыва. Я использую пакет "ape" R для изучения файлов genbank, я использовал функцию read.genbank с 456 идентиф…
20 июл '17 в 20:05
1
ответ
Как мне отредактировать И СОХРАНИТЬ последовательность файла genbank в НОВЫЙ файл genbank, используя biopython?
У меня неправильный файл.gbk, и у меня есть список исправлений, следующий за форматом "Адрес нуклеотида: правильный нуклеотид" 1:T 2:C 4:A 63:A 324:G etc... Я знаю, как открыть и разобрать точную оригинальную последовательность с list(SeqIO.parse(sy…
07 апр '16 в 01:43
2
ответа
Python: регулярные выражения при получении повторяющегося набора чисел
Я работаю с файлом, который является записью Genbank (похоже на это) Моя цель - извлечь числа в строке CDS, например: CDS join(1200..1401,3490..4302) но мое регулярное выражение также должно быть в состоянии извлечь числа из нескольких строк, наприм…
10 мар '16 в 18:46
0
ответов
Био энтрез выдал неполную ошибку при получении последовательностей
Стремясь извлечь ген CO1 из genbank, я столкнулся со следующей ошибкой при использовании пакета biopython entrez: Traceback (most recent call last): File "<ipython-input-3-8de3088e0909>", line 1, in <module> seq2 = fetchDb("nuccore", "CO…
09 янв '18 в 18:53
1
ответ
Преобразование файла формата GenBank в формат FASTA
Я новичок в Java и хочу создать программу, которая может конвертировать текстовый файл GenBank в формат FASTA. В основном будет два текстовых поля: одно, куда я буду загружать файл формата GenBank, и второе, чтобы показать преобразованный файл форма…
06 сен '12 в 15:46
1
ответ
Скачать только часть файла genbank с биопионом
Я новичок в Biopython и у меня проблемы с производительностью при разборе файлов genbank. Я должен разобрать много файлов ГБ, из которых у меня есть номера доступа. После разбора я хочу только изучить таксономию и органеллу файла. Прямо сейчас у мен…
27 июл '16 в 13:13
1
ответ
Сохранить вывод из объекта биопиона в файл?
Здесь у меня есть код, написанный для извлечения "locus_tag" из гена, используя "id". Как я могу сохранить выходные данные из этого в файл в формате с разделенными вкладками???? код принят и изменен https://www.biostars.org/p/110284/ from Bio import…
10 мар '16 в 15:54
1
ответ
SeqIO: "в дескрипторе не найдено записей"
Я только начинаю работать с Python и BioPython, и у меня нет большого опыта программирования. Я был бы благодарен за любую помощь, которую вы, ребята, могли бы оказать мне. Я пытаюсь извлечь последовательности CDS и / или рРНК из genbank. Важно, что…
25 мар '14 в 17:55
1
ответ
socket.gaierror при загрузке файлов genbank с biopython
Я хотел бы загрузить файлы genbank из NCBI, используя Biopython и список номеров доступа (обратите внимание, что в качестве аргумента я вызываю скрипт с адресом электронной почты, например, python scriptName.py emailAddress) import os import os.path…
01 дек '15 в 20:17