Запись небольшого dataframe в csv создает огромный файл

Я пытаюсь написать датафрейм T_df в файл CSV, однако размер сохраненного файла "TFile.csv" увеличивается примерно до 50 ГБ на сервере Microsoft Azure / R. Кто-нибудь испытывал нечто подобное и может посоветовать, пожалуйста?

Пример:

write.csv(T_df,"TFile.csv")

создает файл размером 50 ГБ, в то время как датафрейм не такой большой

object.size(T_df)
2449776 bytes

str(T_df)
'data.frame':   101994 obs. of  3 variables:

1 ответ

Не знаю, есть ли что-то особенное в ваших конкретных данных, но я не вижу этого, когда я запускаю Microsoft R Server версии 9.3.0.

> T_df <- data.frame(a = runif(101994), b = runif(101994), c = runif(101994))
> object.size(T_df)
2448752 bytes
> str(T_df)
'data.frame':   101994 obs. of  3 variables:
 $ a: num  0.248 0.504 0.197 0.634 0.407 ...
 $ b: num  0.226 0.686 0.556 0.629 0.412 ...
 $ c: num  0.959 0.122 0.214 0.666 0.23 ...
 > 
 > write.csv(T_df,"TFile.csv")

TFile.csv составляет 6,1 млн.

Другие вопросы по тегам