Описание тега hama
Apache Hama - это чисто вычислительная среда BSP (Bulk Synchronous Parallel) поверх HDFS (Hadoop Distributed File System) для массовых научных вычислений, таких как матричные, графические и сетевые алгоритмы.
Почему Хама и БСП?
Сегодня многим практическим приложениям обработки данных требуется более гибкая модель абстракции программирования, которая совместима для работы в масштабируемых и масштабируемых системах данных (например, HDFS, HBase и т. Д.). Парадигма передачи сообщений, выходящая за рамки Map-Reduce, повысила бы ее гибкость в возможностях связи Модель Bulk Synchronous Parallel (BSP) заполняет счет соответствующим образом. Некоторые из его существенных преимуществ перед MapReduce и MPI:
- Поддерживает парадигму стиля передачи приложений при разработке приложений.
- Предоставляет гибкий, простой и удобный в использовании маленький API
- Позволяет работать лучше, чем MPI для приложений с интенсивным обменом данными
- Гарантирует невозможность тупиков или коллизий в коммуникационных механизмах.
Источник: Проект Apache Hama