Microsoft.xdf файл
У меня есть вопрос о файле.xdf:
- Что это точно?
- Как работает этот тип файла?
- Как Microsoft R работает с этим типом файла?
- Каковы преимущества перед data.frames?
Я очень жду ваших ответов.
Привет R123456789
1 ответ
Решение
- Файл XDF представляет собой сжатый двоичный формат файла с выбираемыми пользователем уровнями сжатия, некоторые быстрые факты можно найти здесь: https://support.microsoft.com/en-us/help/3104260/qa-what-is-the-.xdf-file-format XDF в формате.xdf-file-format представлены в двух формах: автономной и составной. Для автономных файлов XDF вы увидите один файл, сохраненный на диске с расширением.xdf. Для Composite файл XDF представлен каталогом, который содержит метаданные и подкаталоги данных. Кроме того, для составных файлов, файлов метаданных и данных в этих каталогах они разделяются и сжимаются по отдельности как файлы деталей XDF.
- Это частная реализация внутри Microsoft R Server, я могу расширить этот ответ, но мне нужно уточнить вопрос: "Как работает этот тип файлов?"
- Файл XDF хранится на диске и не хранится в памяти. Microsoft R Server с вызовом RxXdfData() или rxImport() прочитает файл XDF и распакует его, а затем вставит в память как фрейм данных. Многие функции Microsoft R "rx" могут указывать путь к XDF непосредственно в качестве источника или приемника данных и будут управлять чтением сегментов в памяти по мере необходимости.
- Преимущества использования XDF в качестве источника / приемника данных в том, что вам не нужно буферизовать весь файл в памяти, чтобы Microsoft R Server мог с ним работать. Он допускает частичное чтение и запись, а также другие оптимизации дискового пространства посредством сжатия. Он будет работать быстрее, чем чтение / запись из плоских файлов, поскольку метаданные используются для индексации XDF. Недостатками являются, прежде всего, производительность. Во всех случаях данные в памяти (data.frames) будут работать быстрее, чем данные на диске.
Примечание. Как и для всех файлов, базовая операционная система контролирует, когда файл записывается из памяти на диск. Для цели вашего вопроса можно сделать предположение, что файл XDF находится на диске в виде стандартного файла.