Является ли HDF5 подходящей технологией для хранения данных JSON?
Я унаследовал некоторый код, который выполняет вызовы веб-API и получает глубоко вложенный (до восьми уровней) ответ.
Я написал некоторый код, чтобы сгладить структуру, чтобы ее можно было записывать в файлы.csv и базу данных SQL, чтобы людям было проще ее использовать.
Что я действительно хотел бы сделать, так это сохранить версию исходного ответа, так что есть ссылка на исходную структуру, если я когда-нибудь захочу / понадоблюсь.
Я понимаю, что HDF5 в первую очередь предназначен для хранения числовых данных. Есть ли причина не использовать его для создания дампов JSON? Это кажется намного проще, чем настройка базы данных NoSQL.
2 ответа
Это должно быть хорошо. Похоже, вы будете хранить каждый ответ JSON в виде строки переменной длины HDF5. Что хорошо, это просто строка в библиотеку.
Планируете ли вы хранить каждый ответ как отдельный набор данных? Это может быть неэффективно, если вы говорите о>1000 ответов.
Кроме того, вы можете создать расширяемый набор данных 1-го уровня и просто добавлять к нему каждый ответ.