RxXdfData, RxTextData, rxXdfToDataFrame
Я пытаюсь выяснить, что делают эти функции, но я не могу найти много информации об этом, и это не очень ясно из того, что я узнал. Можете ли вы помочь объяснить, что они делают?
заранее спасибо
1 ответ
Когда вы начинаете использовать Revo R или видите данные демонстрации, часто можно увидеть, как функции применяются непосредственно к пути к файлу, например:
# Create a point to an insurance claims dataset installed with RRE
xdfPath <- file.path(rxGetOption("sampleDataDir"), "claims.xdf")
rxDataStep(xdfPath, numRows = 6)
За кулисами, тем не менее, rxDataStep
создает обертку вокруг этого пути к файлу с информацией, которая ему необходима для работы - тип файла, какие переменные нужно прочитать, нужно ли преобразовывать символьные векторы в факторы и т. д. Эта обертка называется "источником данных", и RxXdfData
это функция, используемая для его создания. RxTextData
это то же самое, только для текстовых файлов:
# Create a point to an insurance claims dataset installed with RRE
textPath <- file.path(rxGetOption("sampleDataDir"), "claims.txt")
rxDataStep(textPath, numRows = 6)
Часто вы можете просто позволить функциям RRE позаботиться об этом за вас. Создание источника данных может быть полезно, если у вас есть файл, который должен иметь разные настройки по умолчанию в разных анализах. У них также есть еще одно преимущество: поскольку источником данных является реальный объект R, а не просто путь к файлу, вы можете использовать на них несколько функций R с открытым исходным кодом:
# This doesn't work like we'd expect:
head(xdfPath)
# These do:
xdfSource <- RxXdfData(xdfPath)
head(xdfSource)
names(xdfSource)
nrow(xdfSource)
summary(xdfSource)
Который аккуратен, но не меняет мир.
rxXdfToDataFrame
просто позволяет вам конвертировать файл XDF во фрейм данных в памяти, например так:
rxXdfToDataFrame(xdfSource)
... что также rxDataStep
делает, если вы не даете ему outFile
поэтому я обычно использую rxDataStep
потому что это легче печатать.
Надеюсь это поможет!