Apache Hama - это чисто вычислительная среда BSP (Bulk Synchronous Parallel) поверх HDFS (Hadoop Distributed File System) для массовых научных вычислений, таких как матричные, графические и сетевые алгоритмы.

Почему Хама и БСП?

Сегодня многим практическим приложениям обработки данных требуется более гибкая модель абстракции программирования, которая совместима для работы в масштабируемых и масштабируемых системах данных (например, HDFS, HBase и т. Д.). Парадигма передачи сообщений, выходящая за рамки Map-Reduce, повысила бы ее гибкость в возможностях связи Модель Bulk Synchronous Parallel (BSP) заполняет счет соответствующим образом. Некоторые из его существенных преимуществ перед MapReduce и MPI:

  • Поддерживает парадигму стиля передачи приложений при разработке приложений.
  • Предоставляет гибкий, простой и удобный в использовании маленький API
  • Позволяет работать лучше, чем MPI для приложений с интенсивным обменом данными
  • Гарантирует невозможность тупиков или коллизий в коммуникационных механизмах.

Источник: Проект Apache Hama