Разница между ff и filehash пакетом в R

Question

Разница между ff и filehash пакетом в R

У меня есть датафрейм, состоящий из 25 строк и ~1M строк, разбитый на 12 файлов, теперь мне нужно импортировать их, а затем использовать некоторые reshape пакет для управления данными. Каждый файл слишком велик, поэтому мне нужно искать какое-то "не RAM" решение для импорта и обработки данных, в настоящее время мне не нужно делать никаких регрессий, у меня будет лишь описательная статистика только о фрейме данных.

Я немного искал и нашел два пакета: ff а также filehash, Я читаю filehash Сначала пошли по руководству и обнаружили, что это кажется простым, просто добавили некоторый код при импорте кадра данных в файл, остальное похоже на обычные R-операции.

Я не пробовала ff тем не менее, поскольку он поставляется с множеством различных классов, и мне интересно, стоит ли тратить время на понимание ff сам, прежде чем моя настоящая работа начинается. Но filehash пакет кажется статичным некоторое время, и об этом пакете мало говорят, интересно filehash стал менее популярным или даже устарел.

Может ли кто-нибудь помочь мне выбрать, какой пакет использовать? Или кто-нибудь может сказать мне, в чем разница / плюсы и минусы между ними? Благодарю.

обновление 01

Я сейчас пользуюсь filehash для импорта кадра данных, и понять, что он импортирован с использованием filehash следует считать доступным только для чтения, поскольку все дальнейшие изменения в этом фрейме данных не будут сохранены обратно в файл, если вы не сохраните его снова, что, на мой взгляд, не очень удобно, поскольку мне нужно напомнить себе о необходимости сохранения. Любой комментарий по этому поводу?

7

r import bigdata filehash

Источник

user373908 29 мар '12 в 02:47

0 ответов

Другие вопросы по тегам r import bigdata filehash