В чем разница между распределенным кешем и тахионом?
Распределенный кеш - это метод, который хранит общие запросы и обеспечивает быстрый поиск.
Tachyon - это файловая система распределенного хранения, ориентированная на память, которая позволяет избежать перехода на диск для загрузки часто читаемых наборов данных.
В чем разница между этими двумя?
2 ответа
Основное различие заключается в парадигме программирования, обратите внимание, что по вашему определению Tachyon почти наверняка является распределенным кешем.
Большинство распределенных кэшей, как правило, представляют собой некоторую форму хранилища значений ключей, в то время как структуры данных более высокого уровня могут быть построены на основе этой ключевой парадигмы.
Tachyon предназначен для работы в качестве программной файловой системы, совместимой с интерфейсом HDFS, распространенным в области анализа больших данных. Смысл этого заключается в том, что его можно использовать в качестве капли ускорителя, вместо того, чтобы адаптировать каждую платформу к явному использованию слоя распределенного кэширования.
Обратите внимание, что и Apache Ignite, и Apache Geode (Incubating) являются связанными проектами, которые предлагают как API-интерфейсы со значением ключа, так и стиль файловой системы, что делает их, возможно, более гибкими.
Tachyon (теперь известный как Alluxio) расположен между уровнем вычислений (Apache Spark, Apache Flink, Apache MapReduce) и уровнем хранения (HDFS, Amazon S3, OpenStack Swift, ...).
В основном это файловая система в памяти, используемая для абстрагирования пользователя от систем хранения (одной или нескольких).
Для вычислительных платформ или заданий над ним Tachyon - это хранилище данных, в котором хранятся данные, подлежащие вычислению.
Он не может выполнять расширенные функции распределенных вычислений и не обеспечивает поддержку запросов SQL изначально, как это делают некоторые распределенные кэши (Apache Ignite или Hazelcast).