Спекулятивное тестирование Hadoop

Question

Спекулятивное тестирование Hadoop

Я работаю над Hadoop для моей магистерской диссертации, Hadoop 1.1.2.

Я изучаю новый алгоритм для спекулятивных задач и поэтому на этом первом шаге я пытаюсь применить некоторые изменения в коде.

К сожалению, также используя 2 узла, я не могу вызвать спекулятивное выполнение. Я написал несколько строк кода как Log в классе DefaultTaskSelector (это класс для умозрительной задачи), но этот класс после инициализации никогда не вызывается классом FairScheduler.

Я также активировал опцию "спекулятивный" в файле конфигурации (mapred-site...xml), но ничего.

Итак, вопрос: как я могу вызвать / вызвать спекулятивное исполнение?

С уважением

-1

hadoop task speculative-execution

Источник

user3682798 30 май '14 в 03:20

2 ответа

Другие вопросы по тегам hadoop task speculative-execution

user1056563 30 май '14 в 03:29 2014-05-30 03:29 · Answer 1 · 2014-05-30 03:29

Спекулятивное выполнение обычно происходит, когда работает несколько картографов, и один или несколько из них отстают от других. Хороший способ добиться этого:

настроить улей
настроить секционированную таблицу
убедитесь, что данные достаточно велики для запуска многих картографов. Это означает: как минимум несколько десятков блоков данных HDFS
введите данные в разделы: у одного из разделов с сильно искаженными данными намного больше, чем у других разделов.
запустить выбор * из таблицы

Теперь вы можете увидеть спекулятивный запуск исполнения.

Если нет, не стесняйтесь вернуться сюда. Я могу предоставить дополнительные предложения (например, сделать несколько умеренно сложных запросов, которые могут вызвать SE)

РЕДАКТИРОВАТЬ

Улей может быть немного натяжкой для вас. Но вы можете применить "дух" стратегии и к обычным файлам HDFS. Напишите программу отображения / уменьшения с настраиваемым разделителем, который намеренно искажен: то есть он заставляет один маппер выполнять большую часть работы.

Не забудьте иметь несколько десятков блоков hdfs (по крайней мере), чтобы дать трекерам задач приличный объем работы, чтобы пережевать.

user5170004 04 авг '15 в 13:27 2015-08-04 13:27 · Answer 2 · 2015-08-04 13:27

Вы должны иметь возможность вызывать спекулятивное выполнение, используя два метода: setMapSpeculativeExecution(логическое значение) и setReduceSpeculativeExecution(логическое значение), которые можно указать с помощью Job, конфигурации задания MapReduce.

0

Источник

user5170004 04 авг '15 в 13:27