Описание тега mlcp

Описание тега Вопросы с тегом

MarkLogic Content Pump - это инструмент командной строки на основе Java (mlcp) с открытым исходным кодом. mlcp обеспечивает самый быстрый способ импорта, экспорта и копирования данных в или из баз данных MarkLogic. Он предназначен для интеграции и автоматизации в существующие рабочие процессы и сценарии.

https://developer.marklogic.com/products/mlcp

Гид пользователя

https://docs.marklogic.com/guide/mlcp

особенности

Content Pump может:

Массовая загрузка миллиардов локальных файлов
Разделение и загрузка больших агрегированных файлов XML или текста с разделителями
Массовая загрузка миллиардов троек или четверок из файлов RDF
Архивировать и восстанавливать содержимое базы данных в разных средах
Копирование подмножеств данных между базами данных
Загружать документы из HDFS, включая Hadoop SequenceFiles

Источники данных и места назначения

Content Pump поддерживает перемещение данных между базой данных MarkLogic и любым из следующего:

Локальная файловая система
HDFS
MarkLogic архив
Другая база данных MarkLogic

Форматы

Content Pump поддерживает

XML, JSON, текстовые, двоичные файлы
RDF, закодированный в форматах сериализации RDF/XML, Turtle, RDF/JSON, N3, N-Triples, N-Quads или TriG
Сжатые файлы и архивы (ZIP, GZIP)
Архив MarkLogic, который включает как контент, так и метаданные (например, разрешения и свойства)
Текст с разделителями (например, CSV) (только импорт)
Временные документы
Файлы последовательности Hadoop

Начало работы с MLCP

Вы можете найти этот бесплатный онлайн-курс обучения полезным.

Чтобы начать перенос данных с помощью mlcp, загрузите и распакуйте двоичные файлы. Для тех, кто хочет взломать или посмотреть на внутреннее устройство, вы также можете загрузить лицензионный исходный код Apache 2.0.

Чтобы создать свой первый скрипт импорта, убедитесь, что у вас есть сервер XDBC, подключенный к вашей базе данных (работающий на порту 8006, например, ниже). Из командной строки запустите следующее, подставив свои данные.