Описание тега dna-sequence

A string representing the nucleotide sequence of the deoxyribonucleic acid, the molecule that holds the genes that constitute the genetic code.
3 ответа

Нахождение комплемента последовательности ДНК

Я должен перевести комплемент последовательности ДНК в аминокислоты TTTCAATACTAGCATGACCAAAGTGGGAACCCCCTTACGTAGCATGACCCATATATATATATATA TATATATATATATATGGGTCATGCTACGTAAGGGGGTTCCCACTTTGGTCATGCTAGTATTGAAA +1 TyrIleTyrIleTyrGlySerCysTyrValArgGlyPheProLeuT…
3 ответа

Поиск аминокислотных мотивов в последовательности белка

У меня есть простая поисковая система, состоящая из словаря, в котором коды и последовательности UniProt включены для нескольких записей. В конце концов я хотел бы найти некоторые мотивы во всех этих последовательностях и распечатать их местоположен…
02 апр '14 в 11:21
1 ответ

Как посчитать вхождение символа, а затем найти его процент

Поскольку мы знаем, что три набора кодонов кодируют аминокислоту, например, ATG кодирует только М (метионин) и ATC, ATA, ATT кодирует I (изолейцин) и процент ATG в последовательности ДНК всегда будет равен 1 для кодирования М и процентное содержание…
09 июн '18 в 08:43
0 ответов

Эффективное хранение данных для нуклеотидов с обычными повторами

Я работаю над забавной проблемой, связанной с поиском более эффективного способа хранения генома человеческого малярийного паразита, и я подумал, что было бы полезно получить некоторые из наших идей! Итак, вот справочная информация: предположим, что…
1 ответ

Пометьте и раскрасьте каждое название образца другим цветом с помощью Deprogram в R

Может кто-то помочь мне, пожалуйста? Я пытаюсь нарисовать дендрограмму, используя матрицу расстояний ДНК, используя следующий код. Кажется, все в порядке, но мне кажется, что у каждого экземпляра нет другого цвета; Файл моей матрицы расстояний наход…
19 сен '14 в 15:09
1 ответ

Вычисление расстояния редактирования последовательности ДНК питона

Поэтому мне дана задача выровнять наименьшую стоимость между двумя последовательностями ДНК. Один из неисправных входов CGCAATTCTGAAGCGCTGGGGAAGACGGGT & TATCCCATCGAACGCCTATTCTAGGAT где правильное выравнивание стоило 24, а я получаю стоимость 23 …
0 ответов

Алгоритм C# Needleman-Wunsch с отладкой расширения InDel

Мне нужна помощь в поиске недостатка в реализации моего алгоритма Нидлмана-Вунша. Прямо сейчас, я сосредотачиваюсь на одной проблеме за раз, и проблема, с которой я сталкиваюсь, состоит в том, что при вычислении моего оптимального показателя выравни…
15 сен '16 в 02:02
1 ответ

Скрипт возвращает false независимо от значения

Я создаю программу, которая подтверждает, является ли данная нуклеотидная последовательность палиндромом или нет. Сценарий создает обратное дополнение и сравнивает его с исходной последовательностью, подтверждая, что это палиндром, если 2 совпадают.…
03 дек '15 в 05:14
5 ответов

Генерирование синтетической последовательности ДНК с частотой замещения

Учитывая эти входные данные: my $init_seq = "AAAAAAAAAA" #length 10 bp my $sub_rate = 0.003; my $nof_tags = 1000; my @dna = qw( A C G T ); Я хочу создать: Тысяча длина-10 меток Коэффициент замещения для каждой позиции в теге составляет 0,003 Выходящ…
02 мар '09 в 09:19
6 ответов

Перекрывающиеся спички в R

Я искал и смог найти это обсуждение на форуме для достижения эффекта совпадения совпадений. Я также нашел следующий вопрос SO, говорящий о поиске индексов для выполнения этой задачи, но не смог найти ничего краткого о получении перекрывающихся совпа…
12 сен '14 в 02:56
3 ответа

Как найти конкретную частоту кодона?

Я пытаюсь сделать функцию в R, которая могла бы рассчитать частоту каждого кодона. Мы знаем, что метионин является аминокислотой, которая может быть образована только одним набором кодонов ATG, поэтому его процент в каждом наборе последовательностей…
02 июн '18 в 09:15
3 ответа

Более эффективный способ извлечения строк из огромного файла

У меня есть файл данных с идентификаторами 1 786 916 записей, и я хотел бы получить соответствующие записи из другого файла, который содержит около 4,8 миллиона записей (в данном случае последовательности ДНК, но в основном просто текст). Я написал …
25 мар '18 в 09:10
1 ответ

Я пытаюсь изменить последовательность ДНК

Я пытался изменить комплемент последовательности ДНК фаста. Вот мой код: fastafile=open('sequence (3).fasta','r') entries=[] reverse="" sequence=['A','T','G','C','N'] for line in fastafile: if not line.startswith('>'): line = line.split() entries…
19 фев '17 в 08:28
1 ответ

Добавление меток к отдельным генам с помощью ggbio и ggplot2

Я пытаюсь добавить генные метки к моему графику, который отображает геномные сегменты с помощью пакета ggbio. Я использую autoplot() функция и передать в объект GenomicRanges. У объекта GRange есть столбец меток метаданных, которые я хочу отображать…
07 июл '15 в 02:05
2 ответа

Сравните две последовательности

Мне очень трудно изучать Python 3, и сейчас я борюсь с этим одним упражнением. Я должен написать функцию, которая принимает два аргумента: 1) Строка, которая представляет собой последовательность ДНК. 2) Строка той же длины, что и аргумент один (так…
07 окт '17 в 12:24
1 ответ

Получение исключения вне границ, и я не знаю, как отследить, чтобы найти, где это исключение

Прежде всего, я хотел бы обильно, чем это сообщество, помочь тем, кто только учится программированию, и я прошу вас терпеть меня. вот файл, с которым я работаю: программа секвенирования ДНК Exception in thread "main" java.lang.StringIndexOutOfBounds…
17 апр '14 в 00:42
0 ответов

Перекрывающиеся гены

Я пытаюсь запустить свою программу, но получаю много лишней, ненужной информации. Если вы прокрутите вниз в окне вывода, второй набор генов будет правильным, где не будет совпадений, вместо первого набора. Я также получаю всего 202 гена, тогда как м…
28 дек '15 в 22:33
1 ответ

Почему мой цикл for (python) сдвигается после 4 итераций?

Я пытаюсь написать программу, которая перемещается по элементам определенной длины последовательности ДНК, я не могу понять, какой вывод я получаю из цикла. Похоже, что смещение кадров нормально для первых четырех итераций цикла, а затем, кажется, в…
11 дек '18 в 12:23
0 ответов

РНК Сплайсинг Питон

У меня есть последовательность генов - "acguccgcaagagaagccuuaauauauucaaaaagcuacgccucagauuucgcgcucgagcccaaaacaacugguguacggguugaucacaucaaaugaagucgcuaaagucggugaucucacuauccuugucuucggcuuuugcucucucggcuaucaucuaagcaggcgaguuccauggugaccggaacgacggcuacuggagucca…
01 ноя '18 в 17:48
0 ответов

Создайте дерево Хаффмана с четырьмя символами вместо двоичного

Привет всем. Я разрабатываю двоичное дерево для алгоритма Хаффмана для кодирования строки, но в своей диссертации я хочу закодировать строку для таких символов, как A,B,C,D вместо 0,1, я хочу создать три с четырьмя символами. в алгоритме Хаффмана сн…
17 фев '19 в 07:32