Как сохранить ОЧЕНЬ БОЛЬШОЙ файл.rda в пакете R
Я хочу сохранить две числовые матрицы 460 x 5000 в моем R-пакете. Следуйте инструкциям в: Как эффективно обрабатывать несжатые сохранения во время проверки пакета? Я сохранил объекты как:
save(mat1,file="mat1.rda",compress="xz")
save(mat2,file="mat2.rda",compress="xz")
Тем не менее, результирующие R-объекты довольно большие (8,7 МБ и 8,9 МБ), и R CMD CHECK --as-cran дает мне примечания:
* checking installed package size ... NOTE
installed size is 20.1Mb
sub-directories of 1Mb or more:
data 20.0Mb
В моем понимании, нельзя передать R-пакеты в CRAN, который не "проходит" (т. Е. Нет примечаний и предупреждений) R CMD CHECL --as-cran. Есть ли способ сжать набор данных еще меньше?
2 ответа
Действительно ли необходимо включать эти файлы? Я вижу несколько вариантов:
- Включите меньшее подмножество матрицы, которую вы используете в примерах.
- Генерация матрицы на лету, например, со случайными числами.
- Поместите файлы куда-нибудь для загрузки и убедитесь, что примеры не выполняются.
Рассмотрите возможность распределения данных в отдельном пакете данных, который будет собран, загружен и установлен только один раз (надеюсь). Сравните это с усилиями, необходимыми для повторной передачи одних и тех же данных снова и снова при обновлении пакета.
(Конечно, это применимо, только если вы намереваетесь предоставлять обновления для вашего пакета. Нет разницы, если ваш код совершенен с самого начала;-))