Нет связей данных в базах данных больших таблиц?
Если отношения между данными так же важны, как и сами данные (например, расчеты расстояния или пути), не используйте базу данных семейства столбцов / больших таблиц.
(Цитируется из статьи " Большие горести данных: какую базу данных мне следует использовать? " Эндрю Оливера)
Может ли кто-нибудь уточнить, что Эндрю имел в виду? Это не совсем очевидно для меня.
1 ответ
Большие данные обычно означают, что базы данных распределены на нескольких серверах. Табличные базы данных обычно имеют серьезные проблемы с масштабированием, когда вам нужно объединить записи друг с другом, которые находятся на разных серверах. Это делает их непригодными для сценариев использования, в которых основное внимание уделяется соединениям между записями базы данных. Их языки запросов также часто не очень хорошо оснащены для анализа соединений.
В этом случае вы должны рассмотреть возможность использования графовой базы данных, такой как Neo4j. Плюсы и минусы графовых баз данных описаны ниже в цитируемой вами статье.
К общим областям применения графовых баз данных относятся геопространственные проблемы, механизмы рекомендаций, анализ сети / облака и биоинформатика - в основном везде, где взаимосвязь между данными так же важна, как и сами данные.
Графические базы данных позволяют легко отслеживать отношения между записями базы данных. Они позволяют легко запрашивать такие вещи, как друзья друзей пользователя или всех пользователей с общими интересами.