Файлы FASTQ используются в биоинформатике для хранения информации о последовательности и показателей качества секвенирования.
1 ответ

Python 2.7 filecmp.cmp возвращает false, даже если сжатые файлы идентичны

Я сравниваю кучу файлов fastq.gz. Каждый файл ~4G: if filecmp.cmp(f1,f2,shallow=False) Возвращает false, так как у f1 и f2 разные. Но когда я сравниваю файлы, используя diff/comm, я получаю 0 вывод (я распаковываю и сравниваю). Я попробовал оба мелк…
26 апр '18 в 00:46
1 ответ

Python Def Синтаксическая ошибка с. в имени файла

В моей Visual Code Studio работает python3.6 - мой код сохраняется как "Langemead12Test.py" w/ lines как: ! C: \ Users \ Bones \ Anaconda3 \ python.exe [1] def readFastq (SRR835775_1.first1000.fastq) Красный Ошибка подчеркивания def [pylint] E0001: …
19 июн '18 в 18:50
1 ответ

Формат файла RQC не обнаружен или не поддерживается r блестящий

Я хочу загрузить файл fastq и визуализировать некоторые графики, используя пакет Rqc, особенно функцию rqcQA. Это код: library(shiny) library(Rqc) ui <- fluidPage( titlePanel("Uploading Files"), sidebarLayout( sidebarPanel( fileInput('file1', 'Ch…
04 фев '16 в 17:26
1 ответ

Эффективное разбиение файлов fastq по длине

Я пытаюсь найти менее трудоемкий способ разделения файлов fastq по длине последовательности, то есть разделение одного большого файла fastq на несколько файлов, содержащих только последовательности одинаковой длины. Входные данные - это обычный файл…
11 апр '18 в 14:19
2 ответа

Специальный выходной файл mysql со вставленной строкой?

У меня есть 3 столбца в таблице MySQL, как это COL1 COL10 COL11 longblob1 longblob10 longblob11 Я хочу вывести все в следующем формате: @COL1 COL10 + COL11 (Это называется файл fastq для такого маленького биохимика, как я...) Поэтому я подумал, что …
05 июн '12 в 08:15
0 ответов

Запись последовательности FASTQ не начинается с ошибки строки @NAME

Я бегу Брезек. Я получаю сообщение об ошибке: запись последовательности FASTQ не начинается со строки @NAME. Я точно уверен, что это значит. Я не могу найти ничего о файлах @NAME и FASTQ. Я думал, что это означало добавить строку в начало файла, что…
12 сен '17 в 21:50
1 ответ

Улучшить скорость разбора fastq

@solved C# с тем же кодом в два раза быстрее Я анализирую файл phred33 fastq в Perl, и это занимает значительное количество времени (порядка 15 минут). Файл fastq составляет около 3 гигов. Есть ли разумные способы сделать это быстрее? $file=shift; o…
24 апр '12 в 20:53
2 ответа

Конкатенация файлов в порядке команды Linux

Я только начал учиться использовать командную строку. Надеюсь, это не вопрос дампов. У меня есть следующие файлы в моем каталоге: L001_R1_001.fastq L002_R2_001.fastq L004_R1_001.fastq L005_R2_001.fastq L001_R2_001.fastq L003_R1_001.fastq L004_R2_001…
15 окт '13 в 18:37
2 ответа

Открытие файла с обратной косой чертой в имени, используя переменную в bash

Сложное имя для простого вопроса. Я пытаюсь создать идиотскую программу для людей, с которыми я работаю, когда меня не станет. Я использую чтение, чтобы сохранить имя файла в качестве переменной. Когда я перетаскиваю файл из сгиба, имя которого имее…
09 окт '14 в 20:07
1 ответ

Использование команды sed transiterate в python

Таким образом, есть эта команда sed, которая позволяет вам преобразовать код качества в ASCII в штриховые символы: sed -e 'n;n;n;y/!"#$%&'\''()*+,-.\/0123456789:;<=>?@ABCDEFGHIJKL/▁▁▁▁▁▁▁▁▂▂▂▂▂▃▃▃▃▃▄▄▄▄▄▅▅▅▅▅▆▆▆▆▆▇▇▇▇▇██████/' myfile.fastq…
16 ноя '17 в 18:05
0 ответов

Проблемы запуска разработанных конвейеров NGS для кода Python

Я пытаюсь проанализировать некоторые результаты секвенирования следующего поколения, и у меня возникла проблема с запуском спроектированных конвейеров. Я скачал и распаковал файл python_scripts.tar.gz, содержащий команды python, однако, когда я запу…
11 дек '17 в 14:28
3 ответа

bash: /bin/ls: список аргументов слишком длинный

Мне нужно составить список большого количества файлов (40000 файлов), как показано ниже: ERR001268_1_100.fastq ERR001268_2_156.fastq ERR001753_2_78.fastq ERR001268_1_101.fastq ERR001268_2_157.fastq ERR001753_2_79.fastq ERR001268_1_102.fastq ERR00126…
11 авг '11 в 17:16
2 ответа

Обработка файлов FASTQ на основе длины пары сопряжений

Следующие файлы являются двумя сопряженными файлами парного конца fastq, я хочу разделить каждый fastq на основе их длины. mate1.fq: @SRR127.1 TGGTTATGATGTTTGTGTAGGAATAGAAATTTTGATTAAGATATTAGTGAAATTTGAATGTAGTTTATTTGGAAGTTATGGAGAGTTTATATTGTATTTATGTTTA…
01 май '15 в 08:50
2 ответа

Цикл для объединения нескольких пар файлов с почти одинаковыми именами в UNIX

У меня очень простой вопрос, но я не могу найти решение. У меня есть несколько файлов в одном каталоге, и я хотел бы объединить каждую пару файлов. Имена: Sample1_R1_L001.fastq Sample1_R2_L001.fastq Sample2_R1_L001.fastq Sample2_R2_L001.fastq Sample…
29 июл '14 в 15:38
2 ответа

Как мне использовать параллельное программирование / многопоточность в моем скрипте bash?

Это мой сценарий: #!/bin/bash #script to loop through directories to merge fastq files sourcedir=/path/to/source destdir=/path/to/dest for f in $sourcedir/* do fbase=$(basename "$f") echo "Inside $fbase" zcat $f/*R1*.fastq.gz | gzip > $destdir/"$…
22 авг '13 в 15:17
3 ответа

Grep, который допускает несоответствия подмножеству.fastq

Я работаю с Bash на кластере Linux. Я пытаюсь извлечь чтения из файла.fastq, если они содержат совпадение с запрашиваемой последовательностью. Ниже приведен пример файла.fastq, содержащий три чтения. $ cat example.fastq @SRR1111111.1 1/1 CTGGANAAGTG…
13 дек '18 в 18:58
1 ответ

Как я могу создать файл последовательности FASTQ?

У меня есть геномная база данных, которая содержит простую последовательность символов (например, >chr1 AGTGTCA.....). Теперь я хочу преобразовать его в стандартный формат FASTQ следующим образом: @HWUSI-EAS594-R:1:3:1453:1350#0/1 CCCAGTTCCGACGAT…
10 июл '11 в 01:14
1 ответ

Повышение производительности скрипта Python для фильтрации непарных операций чтения в паре файлов FASTQ

У меня есть парные данные о конце последовательности. Тем не менее, файлы не правильно спарены. Существуют непарные чтения, которые необходимо удалить, чтобы обеспечить согласованность файлов чтения пары. Хотя есть такие решения, как использование T…
09 апр '16 в 14:06
0 ответов

Не удается преобразовать файл fastq в файл fasta в Windows

У меня есть этот код, который читает из файла и записывает в другой файл, но файл записи пуст. f=open(FASTQFILE, "r") fo=open(FASTAFILE, "w") while True: header=f.read() if not header:break header=header.strip() seq=f.readline() seq=seq.strip() igno…
07 сен '18 в 16:07
2 ответа

Получение разных выходных файлов

Я делаю тест с этими файлами: comp900_c0_seq1_Glicose_1_ACTTGA_merge_R1_001.fastq comp900_c0_seq1_Glicose_1_ACTTGA_merge_R2_001.fastq comp900_c0_seq2_Glicose_1_ACTTGA_merge_R1_001.fastq comp900_c0_seq2_Glicose_1_ACTTGA_merge_R2_001.fastq comp995_c0_…
05 фев '14 в 16:36