Как mapTo более эффективен, чем map в Scalding?
Ссылка Scalding на Github ( https://github.com/twitter/scalding/wiki/Fields-based-API-Reference) гласит следующее:
MapTo эквивалентно отображению и затем проецированию на новые поля, но более эффективно. Таким образом, следующие две строки дают одинаковый результат:
pipe.mapTo(existingFields -> additionalFields){ ... } pipe.map(existingFields -> additionalFields){ ... }.project(additionalFields)
Мой вопрос:
- Как mapTo более эффективно, чем map?
1 ответ
Решение
Поскольку вы указываете, какие поля остаются, нет необходимости сохранять поля, которые будут отбрасываться по пути при выполнении map
операция.
В зависимости от количества отброшенных полей и объема данных, разница может быть очень заметной.