Как mapTo более эффективен, чем map в Scalding?

Ссылка Scalding на Github ( https://github.com/twitter/scalding/wiki/Fields-based-API-Reference) гласит следующее:

MapTo эквивалентно отображению и затем проецированию на новые поля, но более эффективно. Таким образом, следующие две строки дают одинаковый результат:

pipe.mapTo(existingFields -> additionalFields){ ... } pipe.map(existingFields -> additionalFields){ ... }.project(additionalFields)

Мой вопрос:

  • Как mapTo более эффективно, чем map?

1 ответ

Решение

Поскольку вы указываете, какие поля остаются, нет необходимости сохранять поля, которые будут отбрасываться по пути при выполнении map операция.

В зависимости от количества отброшенных полей и объема данных, разница может быть очень заметной.

Другие вопросы по тегам