Neo4j - импортировать очень большой CSV в существующую базу данных

Я довольно новичок в Neo4j и уже потерян со всей устаревшей документацией и очень неясными командами, их эффектом или скоростью.

Я ищу способ быстро импортировать очень большие данные. Данные представлены в масштабе B для одного вида данных, разделенных на несколько CSV, но я не против объединить их в один.

Выполнение очень простого импорта (load csv ... create (n:XXX {id: row.id}) занимает много времени, особенно с уникальным индексом, это занимает дни. Я остановил операции, отбросил уникальный индекс и перезапустил, примерно в 2 раза быстрее, но все еще слишком медленно.

Я знаю о neo4j-import (хотя и устарел, и на сайте neo4j нет документации о "neo4j-admin import"). Уже крайне непонятно, как делать простые вещи вроде условного. Самым большим обломом является то, что он не работает с существующей базой данных.

Главный вопрос заключается в том, есть ли способ ускорить импорт очень больших CSV-файлов с помощью neo4j? Сначала с простым утверждением типа create, но, надеюсь, и с match. Прямо сейчас выполнение команды шифрования, такой как "match (n: X {id:" Y "})) return n limit 1", занимает несколько минут на узлах 1B.

(Я использую это на сервере с 200 ГБ ОЗУ и 48 ЦПУ, так что, вероятно, это не ограничение с аппаратной точки зрения).

0 ответов

Другие вопросы по тегам