Кратчайший способ просмотра LMDB в пандах под ноутбуком Jupyter
TLDR: Как я могу проверить \ просмотреть двоичный файл LMDB?
Завершите py n00b здесь. Я только что положил файл LMDB на колени, чтобы проанализировать ошибки данных, которые вызывают ошибки в последующем программном обеспечении. Я не знаю схему данных, и ее размер составляет около 1 Гб. Я потратил около часа на поиски способа вопросов и ответов, чтобы использовать jupyter и pandas для просмотра файла, не зная схемы, но не испытывая радости.
Какой самый короткий способ сделать это? Ссылка будет в порядке.
1 ответ
lmdb - это тип встроенного хранилища значений ключей:
Пакет LMDB Python: https://lmdb.readthedocs.io/en/release/
Вы можете использовать этот пакет для чтения БД либо по определенным ключам, либо итерируя по нему. обратите внимание, что обычной практикой является то, что сами значения являются двоичными сериализованными объектами - вам придется проверить их, чтобы увидеть, как они форматируются