Как связать два фрейма диска вместе?
У меня есть два дисковых фрейма, каждый из которых содержит около 20 ГБ файлов.
Он слишком велик для объединения в виде таблиц данных, потому что для этого процесса требуется больше, чем имеющаяся у меня память. Я пробовал использовать этот код:
output <- rbindlist(list(df1, df2))
Морщинка в том, что я бы тоже хотел запустить
unique
поскольку в моих данных могут быть дубли.
Могу ли я использовать тот же код с
rbindlist
на двух дисковых фреймах?
1 ответ
Решение
Да уж. Ты просто делаешь
rbindlist.disk.frame(list(df1, df2))
Мне нужно реализовать
bind_rows
в какой-то момент тоже!