PDF файл загружается в R, но файл не открывается
У меня есть файл Excel, содержащий названия компаний и загружаемые ссылки на их файлы.pdf. Моя цель состоит в том, чтобы создать каталоги в соответствии с названием компании в столбце Excel и загрузить файл PDF в недавно созданный каталог. Лист Excel содержит ссылку в виде:- www.xyz.com/filehandler/filedisplay.aspx?fn=blahblahblahh&fname=ContractingCompanyname Таким образом, пришлось добавить к нему "https://", прежде чем использовать его в функции загрузки файла. Кроме того, приведенная выше ссылка относится к защищенному сайту моей компании, который при запуске вручную загружает файл PDF.
Моя проблема в том, что PDF-файл загружен. Тем не менее он выдает ошибку при открытии файла, который представляет собой изображение ошибки открытия файла PDF.
Я ссылался на многие сайты и использовал все, включая RCurl, curl, а также консоль R и R studio для запуска своего кода. Каждый раз, когда файл загружается, но при открытии выдает ту же ошибку.
Вот мой код
##Set the working directory
txtsrc<-"C:\\Users\\skrishnan\\Desktop\\HR needed\\text analysis proj\\pdf\\FirstAid"
setwd(txtsrc)
##make a vector of contractor's safety program's raw txt file names
pdflist <- read.xlsx("Final results_6thjuly.xlsx",1)
##Check records
head(pdflist)
tail(pdflist)
colnames(pdflist)
##Check if docs folder exists
if (dir.exists("FirstAid_docs")=="FALSE"){
dir.create("FirstAid_docs")
}
##Change the working directory
newfolder<-c("FirstAid_docs")
newpath<-file.path(txtsrc,newfolder)
setwd(newpath)
##Check the present working directory
getwd()
## Create directories and download files
for( i in 1:length(pdflist[,c("ci_CompanyName")])){
##First delete the existing directories
if(dir.exists(pdflist[,c("ci_CompanyName")][i])=="TRUE"){
unlink(pdflist[,c("ci_CompanyName")][i], recursive = TRUE)
}
##Create a new directory
directoryname<-pdflist[,c("ci_CompanyName")][i]
dir.create(directoryname,recursive = FALSE, mode = "644")
##Get the downloadable links
link<-pdflist[,c("DocLink")][i]
vallink<-c("https://")
newlink<-paste0(vallink,link)
stringlink<-as.character(newlink)
pdffilename<-paste0(strsplit(stringlink,"&fname=")[[1]][2],".pdf")
##Set paths for the downloadble file
newway<-file.path(newpath,directoryname)
destfile<-paste(newway,pdffilename,sep="/")
##Download the file
download.file(stringlink,destfile,mode="w",method="auto",quiet = FALSE, cacheOK = TRUE)
##Next record
i<-i+1
}
Несколько вещей, которые помогут понять код
> R.Version()
$`platform`
[1] "x86_64-w64-mingw32"
$arch
[1] "x86_64"
$os
[1] "mingw32"
$system
[1] "x86_64, mingw32"
$status
[1] ""
$major
[1] "3"
$minor
[1] "5.0"
$year
[1] "2018"
$month
[1] "04"
$day
[1] "23"
$`svn rev`
[1] "74626"
$language
[1] "R"
$version.string
[1] "R version 3.5.0 (2018-04-23)"
$nickname
[1] "Joy in Playing"
> colnames(pdflist)
[1] "ci_CompanyID" "ci_CompanyName" "ProgramScore" "ID_DI" "DocLink"
Любая помощь с благодарностью.