"Слишком много ошибок извлечения" при использовании Hive

Я выполняю запрос улья против кластера hadoop из 3 узлов. И я получаю сообщение об ошибке "Слишком много ошибок извлечения". Мой улей запрос:

  insert overwrite table tablename1 partition(namep)
  select id,name,substring(name,5,2) as namep from tablename2;

это запрос, который я пытаюсь выполнить. Все, что я хочу сделать, это перенести данные из tablename2 в tablename1. Любая помощь приветствуется.

1 ответ

Решение

Это может быть вызвано различными проблемами конфигурации hadoop. Вот пара, чтобы искать в частности:

  • Проблема с DNS: изучите свой /etc/hosts
  • Недостаточно http потоков на стороне картографа для редуктора

Некоторые предлагаемые исправления (из устранения неполадок Cloudera)

  • задавать mapred.reduce.slowstart.completed.maps = 0.80
  • tasktracker.http.threads = 80
  • mapred.reduce.parallel.copies = sqrt (node count) but in any case >= 10

Вот ссылка на устранение неполадок для более подробной информации

http://www.slideshare.net/cloudera/hadoop-troubleshooting-101-kate-ting-cloudera

Другие вопросы по тегам