Описание тега bioinformatics

По вопросам программирования, связанным с биоинформатикой. Другие вопросы здесь не относятся, но могут быть по теме на https://bioinformatics.stackexchange.com/.
1 ответ

Взрыв Две последовательности из сценария Python

У меня есть список пар белков, и я хочу сравнить скорость и точность "BLAST Two Sequence" с программой Смита-Уотермана для выравнивания. Я знаю, что на веб-сайте NCBI есть опция "Blast Two Sequence", но я бы хотел запустить ее из скрипта Python. Воз…
15 апр '12 в 07:48
4 ответа

Python: добавление целых элементов вложенного списка в список

Итак, у меня есть два списка, целочисленные элементы которых необходимо добавить. nested_lst_1 = [[6],[7],[8,9]] lst = [1,2,3] Мне нужно добавить их так, чтобы каждый элемент во вложенном списке был добавлен к соответствующему целому числу в 'lst', …
08 окт '18 в 19:50
1 ответ

Как я могу объединить строки CSV, которые имеют одинаковое значение в первой ячейке?

Это файл: https://drive.google.com/file/d/0B5v-nJeoVouHc25wTGdqaDV1WW8/view?usp=sharing Как видите, в первом столбце есть дубликаты, но если бы я соединил дублирующиеся строки, никакие данные не были бы переопределены в других столбцах. Есть ли спос…
1 ответ

Заменить значения символьного столбца, используя другой столбец, с определением шаблона

У меня есть фрейм данных pedigrees образцов, разбитых на семьи: pedigrees %>% filter(Family %in% sample(pedigrees$Family, 5) Family_ID Sample_ID fatherID motherID sex status <chr> <chr> <chr> <chr> <int> <int> …
01 май '18 в 20:29
1 ответ

Соответствующие кодоны с использованием списков, словарей и циклов

Это одна из наиболее сложных проблем, с которыми я сталкивался до сих пор, так что извините за то, что я не предоставил существенной попытки сделать это. Я хочу программу, которая печатает соответствующие кодоны в формате: AAA : TTT GGG : CCC TTT : …
2 ответа

Как сравнить колонки из двух CSV в питоне?

Привет у меня есть два CSV-файла в качестве ввода, например: файл1: AK163828 chr5 s1 + e1 cttt 4 AK163828 chr5 s2 + e2 gtca 4 AK168688 chr6 s3 + e3 ggcg 4 AK168688 chr6 s4 + e4 tctg 4 файл2: chr6s3+e3 ggcg chr5s1+e1 cttt chr6s4+e4 tata chr5s2+e2 ggc…
14 май '11 в 19:18
2 ответа

Создание функции, позволяющей создать строку заголовка и столбец с именами строк

Я определяю функцию, которая будет возвращать список списков, где нулевой элемент - это 2Darray, первый элемент - это информация заголовка, а второй - имя строки. Как я могу прочитать это из файла, где файл выглядит так: гены S1 S2 S3 S4 S5 100 -0,2…
08 май '11 в 22:29
2 ответа

Где я могу скачать данные генной экспрессии?

Я хотел загрузить данные по экспрессии генов, полученные из экспериментов с микрочипами. я не знаю слишком много об этом предмете, но, как я понимаю, строки часто соответствуют генам, а столбцы соответствуют образцам. в идеале я ожидаю матрицу данны…
23 мар '12 в 04:19
1 ответ

Запись в файл с изменением кортежа

Мой код проходит последовательность ДНК и записывает позиции ORF, с которыми он сталкивается в этой последовательности. Я пытаюсь сделать две вещи. Делайте цикл программы, пока он не найдет все ORF, не первые, через которые он проходит Записать резу…
13 ноя '15 в 01:26
6 ответов

Каков хороший способ реализации получения консенсусной последовательности в Java?

У меня есть следующая проблема: У меня есть 2 последовательности последовательностей ДНК (состоящих из ACGT), которые отличаются в одном или двух местах. Найти различия тривиально, поэтому давайте просто проигнорируем это для каждого различия я хочу…
21 дек '11 в 13:05
1 ответ

Автоматически разбивает неоднозначные основания пропорционально A, C, G или T

В Biostrings я загрузил файл fasta из 427 351 последовательности ДНК длиной 11 нуклеотидов. my.seq<-readDNAStringSet("my.fasta", "fasta") Затем я сгенерировал матрицу, которая подсчитывает общее количество определенного нуклеотида в каждой из 11 …
18 мар '16 в 11:25
0 ответов

Любой R-пакет для расчета "Мутации"

У меня большая семейная информация (родители и дети). Все они в форме аллелей. т.е. два аллеля в каждом локусе и субъекте. Наша задача состоит в том, чтобы вычислить частоту мутаций / количество (несоответствие между аллелями ребенка и аллелями роди…
07 июн '12 в 01:16
0 ответов

Проблема установки Usearch в Ubuntu Bash для Windows 10

Я пытаюсь запустить usearch v11.0,667 (-32bit) через Ubuntu Bash в Windows 10 (-64bit). Я скачал его и сделал его исполняемым через chmod: ~/user_bin# ls -l -rwxr-xr-x 1 root root 3024491 Nov 20 17:50 usearch И моя папка (user_bin) уже находится в P…
1 ответ

Ошибка при создании SummarizedExperiment

Я хочу сделать SummarizedExperiment, у меня есть таблица подсчета в этом формате в FeatureCount.txt SRR1554537 SRR1554538 SRR1554541 SRR1554535 SRR1554536 SRR1554539 1/2-SBSRNA4 39 66 72 23 16 7 A1BG 221 113 226 146 36 126 A1BG-AS1 393 296 527 276 3…
03 окт '16 в 08:03
3 ответа

Альтернативы для петли в R?

Я получил 2 файла, которые я хотел бы объединить, используя R. head(bed) chr8 41513235 41513282 ANK1.Exon1 chr8 41518973 41519092 ANK1.Exon2 Первый дает интервалы и их имена. (Хромосома, от, до, имя) head(coverage) chr1 41513235 20 chr1 41513236 19 …
19 май '15 в 08:45
3 ответа

Нахождение комплемента последовательности ДНК

Я должен перевести комплемент последовательности ДНК в аминокислоты TTTCAATACTAGCATGACCAAAGTGGGAACCCCCTTACGTAGCATGACCCATATATATATATATA TATATATATATATATGGGTCATGCTACGTAAGGGGGTTCCCACTTTGGTCATGCTAGTATTGAAA +1 TyrIleTyrIleTyrGlySerCysTyrValArgGlyPheProLeuT…
4 ответа

Избегание печатного пространства в регулярных выражениях

У меня есть выход BLAST в формате по умолчанию. Я хочу анализировать и извлекать только ту информацию, которая мне нужна, с помощью регулярных выражений. Тем не менее, в строке ниже Query= contig1 Между '=' и 'contig1' есть пробел. Так что в моем вы…
09 май '14 в 11:07
3 ответа

Реализуйте эти функции, используя Matlab

У меня есть массив сэмплов ЭКГ сигналов 1250х1 с двойным, давайте назовем его "а". Мне нужно реализовать 4 функции, которые представляют функции, используемые для характеристики сигналов. Энергия, 4-я степень, нелинейная энергия и длина кривой Мне у…
3 ответа

Поиск аминокислотных мотивов в последовательности белка

У меня есть простая поисковая система, состоящая из словаря, в котором коды и последовательности UniProt включены для нескольких записей. В конце концов я хотел бы найти некоторые мотивы во всех этих последовательностях и распечатать их местоположен…
02 апр '14 в 11:21
1 ответ

"В данных (A): набор данных (A) не найден" (но> read.table(A) в порядке)

По словам (Mfuzz (программное обеспечение для кластеризации)) http:// 127.0.0.1:14087/library/utils/html/data.html Я хочу создать data(...) из моего файла, который является.txt. Используя команды: read.table(), head(), summary() << данные можно расп…
09 окт '14 в 10:07