Разница между ff и filehash пакетом в R
У меня есть датафрейм, состоящий из 25 строк и ~1M строк, разбитый на 12 файлов, теперь мне нужно импортировать их, а затем использовать некоторые reshape
пакет для управления данными. Каждый файл слишком велик, поэтому мне нужно искать какое-то "не RAM" решение для импорта и обработки данных, в настоящее время мне не нужно делать никаких регрессий, у меня будет лишь описательная статистика только о фрейме данных.
Я немного искал и нашел два пакета: ff
а также filehash
, Я читаю filehash
Сначала пошли по руководству и обнаружили, что это кажется простым, просто добавили некоторый код при импорте кадра данных в файл, остальное похоже на обычные R-операции.
Я не пробовала ff
тем не менее, поскольку он поставляется с множеством различных классов, и мне интересно, стоит ли тратить время на понимание ff
сам, прежде чем моя настоящая работа начинается. Но filehash
пакет кажется статичным некоторое время, и об этом пакете мало говорят, интересно filehash
стал менее популярным или даже устарел.
Может ли кто-нибудь помочь мне выбрать, какой пакет использовать? Или кто-нибудь может сказать мне, в чем разница / плюсы и минусы между ними? Благодарю.
обновление 01
Я сейчас пользуюсь filehash
для импорта кадра данных, и понять, что он импортирован с использованием filehash
следует считать доступным только для чтения, поскольку все дальнейшие изменения в этом фрейме данных не будут сохранены обратно в файл, если вы не сохраните его снова, что, на мой взгляд, не очень удобно, поскольку мне нужно напомнить себе о необходимости сохранения. Любой комментарий по этому поводу?