Инструмент BWA с потоковой передачей

Burrows-Wheeler Aligner(BWA), биоинформационный инструмент (алгоритм) для сопоставления коротких нуклеотидных последовательностей с эталонным геномом. Я пытался запустить BWA с использованием потоковой передачи Hadoop, но получил ошибку.

Команда:

hadoop/bin/hadoop jar $HADOOP_HOME/contrib/streaming/hadoop-streaming-1.1.1.jar -input /user/hduser/bwainput/chr21.fa -output /user/hduser/bwa_output17 -mapper "/home/hduser/Desktop/bwa-0.7.5a/bwa index /user/hduser/bwainput/chr21.fa" -file /home/hduser/Desktop/bwa_input/chr21.fa

Сообщение об ошибке:

INFO streaming.StreamJob: Tracking URL: /ubuntu:50030/jobdetails.jsp?jobid=job_201401230236_0007
ERROR streaming.StreamJob: Job not successful.
Error: # of failed Map Tasks exceeded allowed limit. FailedCount:1
INFO streaming.StreamJob: killJob...

Подскажите пожалуйста, как решить эту проблему? Спасибо за вашу помощь.

1 ответ

Вы можете запустить инструмент bwa mem с помощью потоковой передачи hadoop с помощью следующей команды

hduser@ubuntu:~/apps/hadoop$ bin/hadoop jar $HADOOP_HOME/contrib/streaming/hadoop-streaming-1.1.1.jar -input /user/hduser/fastq/ERR091571.fastq -output 

/user/hduser/bwa_output33 -mapper 'bwa mem -p s_suis.fa -' -reducer 'cat' -file bwa -file s_suis.fa -file s_suis.fa.amb -file s_suis.fa.ann -file s_suis.fa.bwt -file s_suis.fa.pac -file s_suis.fa.sa -numReduceTasks 1

Обратитесь по этой ссылке для более подробной информации

Другие вопросы по тегам