Обучение Neo4j GraphSage ничего не регистрирует
Я работаю над извлечением вложений графов с помощью обучающего алгоритма GraphSage. Я работаю над большим графом, состоящим из (82339589) узлов и (219521164) ребер. Когда я проверил с помощью команды «: запросы», запрос отображается как выполняющийся. Алгоритм запущен 6 дней назад. Когда я смотрю журналы с «docker logs xxx», последние журналы перечислены как
2021-12-01 12:03:16.267+ 0000 Сканирование хранилища взаимосвязей INFO (RelationshipScanCursorBasedScanner): импортировано 352492468 записей и 0 свойств из 16 247 МБ (17 036 668 320 байт); заняло 59,057 с, 5,968,663,57 Отношения / с, 275 МиБ / с (288,477,487 байт / с) (на поток: 1,492,165,89 Отношения / с, 68 МиБ / с (72,119,371 байт / с))
2021-12-01 12:03:16.269+ 0000 ИНФОРМАЦИЯ [neo4j.BoltWorker-3 [bolt] [/10.0.0.6:56143]] ЗАГРУЗКА
ИНФОРМАЦИЯ [neo4j.BoltWorker-3 [bolt] [/10.0.0.6:56143]] ЗАГРУЗКА Фактическое использование памяти загруженного графа: 8602 МБ
ИНФОРМАЦИЯ [neo4j.BoltWorker-3 [bolt] [/10.0.0.6:64076]] GraphSageTrain ::Start
Есть возможность просмотреть подробные журналы тренировочного процесса. Это нормально, если для графиков общих размеров требуется 6 дней?
1 ответ
GraphSAGE обычно занимает много времени по сравнению с FastRP или Node2Vec. Начиная с GDS 1.7, вы можете использовать
CALL gds.beta.listProgress(jobId: String)
YIELD
jobId,
taskName,
progress,
progressBar,
status,
timeStarted,
elapsedTime
Если вы вызываете без передачи jobId, он вернет список всех запущенных заданий. Если вы позвоните с помощью jobId, он предоставит вам подробную информацию о запущенном задании.
Этот запрос будет обобщать детали для работы
03d90ed8-feba-4959-8cd2-cbd691d1da6c
.
CALL gds.beta.listProgress("03d90ed8-feba-4959-8cd2-cbd691d1da6c")
YIELD taskName, status
RETURN taskName, status, count(*)
Вот документация для регистрации прогресса . Процедуры мониторинга системы также могут быть вам полезны.