R для цикла работает только для одного файла
Я пытался запустить цикл for для нескольких файлов CSV в R. Но цикл работает только для первого файла.
Я хочу импортировать CSV-файлы, а затем создать каталог для каждого CSV-файла, где будет храниться анализ его данных. После создания каталогов у меня возникают проблемы с установкой его в качестве рабочего каталога каждый раз, когда я запускаю свой код. Мой код прекрасно работает, когда это всего один файл, но он не работает, когда я использую циклы for.
Код:
## Setting the working directory and path
setwd("path")
path <- "path"
##to extract the filename from each path
files <- list.files(path=path, pattern="*.csv")
for(file in files)
{
temp <- which(strsplit(file, "")[[1]]==".")
assign(
gsub(" ","",substr(file, 1, temp-1)),
read.csv(paste(path,file,sep="")))
}
##To create a new directory for each file and set that as the new working directory.
for(i in seq(1, length(files), by = 1)){
fileName <- read.csv(files[i])
base <- strsplit(files[i], ".csv")[[1]]
dir <- dir.create(paste(path,base, sep = "/"))
setwd(getwd(dir))
Дальнейший анализ с результатами, сохраненными во вновь установленном рабочем каталоге.
Создание переменных
Date_Time <- strptime(fileName$Date...Time, format = "%d/%m/%Y %H:%M")
fileName$month <- months(Date_Time,abbreviate = TRUE) #creates month column (char)
fileName$julian <- Date_Time$yday #creates julian day column
fileName$year <- Date_Time$year + 1900 #creates year column
fileName$hour <- Date_Time$hour #creates hour column
fileName$weeknum <- round(Date_Time$yday/7,0)
fileName$numericdate <- fileName$year+fileName$julian/366 #numeric value of date
#Identify and remove empty columns
fileName <- as.data.table(fileName)
fileName <- fileName[,which(unlist(lapply(fileName, function(x)!all(is.na(x))))),with=F]
dim(fileName) # to check if empty columns have been eliminated
head(fileName) #to find appropriate column name for PM10 data
PM10 <- fileName$PM10_BAM #substitue in a common variable for further calculations
fileName$PM10_BAM <- as.numeric(as.character(PM10))
##to view basic seasonal pattern through the data
df_eve <- subset(fileName, hour>=18)
jpeg(file = "seasonal pattern observed in the evenings.jpg")
with(df_eve, boxplot(PM10_BAM ~ weeknum, main = "seasonal pattern observed in the evenings", xlab = "weeknum", ylab = "PM10", outline = FALSE, na.rm = T))
dev.off()
}
Errors:
Error in file(file, "rt") : cannot open the connection In addition: Warning messages:
1: In dir.create(paste(path, base, sep = "/")) :
'/Users/ayushikachhara/Desktop/Work/CSV//EW_Matamata' already exists
2: NAs introduced by coercion
3: In file(file, "rt") :
cannot open file 'EW_Ngaruawahia.csv': No such file or directory
EW_Matamata и EW_Ngaruawahia - это файлы в изначально установленном рабочем каталоге. Но так как я импортирую их и затем изменяю каталог, я не понимаю, почему я продолжаю получать 3-е сообщение об ошибке.
Любая помощь приветствуется, так как я нахожусь на стадии обучения:)
1 ответ
Проверьте эту строку вашего кода.
dir <- dir.create(paste(path,base, sep = "/"))
setwd(getwd(dir))
Теперь, когда он получает первый файл, он создает новый каталог и устанавливает рабочий каталог в качестве каталога вновь созданного каталога. Поэтому, когда он ищет второй файл в текущем каталоге, его там явно нет.