Добавление разделов во внешнюю таблицу в улье занимает много времени

Я хотел бы знать, как лучше всего добавить разделы во внешнюю таблицу. У меня есть внешняя таблица на S3 в улье с разделом как vehicle=/date=/hr=


Теперь новое транспортное средство можно добавить в любое время суток, и будут автомобили, которые не будут иметь данных пару часов в день или пару дней.

Несколько возможных решений - таблица msck reapir: это занимает много времени - Добавить раздел с помощью скрипта: я могу не знать, когда будет создано новое транспортное средство или какие часовые данные отсутствуют для транспортного средства

Как вообще люди решают эту проблему добавления разделов во внешние таблицы

1 ответ

msck reapir tableправильный способ сделать это. Если он работает слишком медленно, попробуйте отключить автосбор статистики перед восстановлением таблицы:

set hive.stats.autogather=false;

Вы можете снова включить его после восстановления разделов.

Скорее всего, вы столкнулись с HIVE-18743 или связанной с ним ошибкой. В моем случае это помогло.

Другие вопросы по тегам