Описание тега mlcp
MarkLogic Content Pump - это инструмент командной строки на основе Java (mlcp) с открытым исходным кодом. mlcp обеспечивает самый быстрый способ импорта, экспорта и копирования данных в или из баз данных MarkLogic. Он предназначен для интеграции и автоматизации в существующие рабочие процессы и сценарии.
https://developer.marklogic.com/products/mlcp
Гид пользователя
https://docs.marklogic.com/guide/mlcp
особенности
Content Pump может:
- Массовая загрузка миллиардов локальных файлов
- Разделение и загрузка больших агрегированных файлов XML или текста с разделителями
- Массовая загрузка миллиардов троек или четверок из файлов RDF
- Архивировать и восстанавливать содержимое базы данных в разных средах
- Копирование подмножеств данных между базами данных
- Загружать документы из HDFS, включая Hadoop SequenceFiles
Источники данных и места назначения
Content Pump поддерживает перемещение данных между базой данных MarkLogic и любым из следующего:
- Локальная файловая система
- HDFS
- MarkLogic архив
- Другая база данных MarkLogic
Форматы
Content Pump поддерживает
- XML, JSON, текстовые, двоичные файлы
- RDF, закодированный в форматах сериализации RDF/XML, Turtle, RDF/JSON, N3, N-Triples, N-Quads или TriG
- Сжатые файлы и архивы (ZIP, GZIP)
- Архив MarkLogic, который включает как контент, так и метаданные (например, разрешения и свойства)
- Текст с разделителями (например, CSV) (только импорт)
- Временные документы
- Файлы последовательности Hadoop
Начало работы с MLCP
Вы можете найти этот бесплатный онлайн-курс обучения полезным.
Чтобы начать перенос данных с помощью mlcp, загрузите и распакуйте двоичные файлы. Для тех, кто хочет взломать или посмотреть на внутреннее устройство, вы также можете загрузить лицензионный исходный код Apache 2.0.
Чтобы создать свой первый скрипт импорта, убедитесь, что у вас есть сервер XDBC, подключенный к вашей базе данных (работающий на порту 8006, например, ниже). Из командной строки запустите следующее, подставив свои данные.