Нет связей данных в базах данных больших таблиц?

Если отношения между данными так же важны, как и сами данные (например, расчеты расстояния или пути), не используйте базу данных семейства столбцов / больших таблиц.

(Цитируется из статьи " Большие горести данных: какую базу данных мне следует использовать? " Эндрю Оливера)

Может ли кто-нибудь уточнить, что Эндрю имел в виду? Это не совсем очевидно для меня.

1 ответ

Решение

Большие данные обычно означают, что базы данных распределены на нескольких серверах. Табличные базы данных обычно имеют серьезные проблемы с масштабированием, когда вам нужно объединить записи друг с другом, которые находятся на разных серверах. Это делает их непригодными для сценариев использования, в которых основное внимание уделяется соединениям между записями базы данных. Их языки запросов также часто не очень хорошо оснащены для анализа соединений.

В этом случае вы должны рассмотреть возможность использования графовой базы данных, такой как Neo4j. Плюсы и минусы графовых баз данных описаны ниже в цитируемой вами статье.

К общим областям применения графовых баз данных относятся геопространственные проблемы, механизмы рекомендаций, анализ сети / облака и биоинформатика - в основном везде, где взаимосвязь между данными так же важна, как и сами данные.

Графические базы данных позволяют легко отслеживать отношения между записями базы данных. Они позволяют легко запрашивать такие вещи, как друзья друзей пользователя или всех пользователей с общими интересами.

Другие вопросы по тегам