PDF файл загружается в R, но файл не открывается

У меня есть файл Excel, содержащий названия компаний и загружаемые ссылки на их файлы.pdf. Моя цель состоит в том, чтобы создать каталоги в соответствии с названием компании в столбце Excel и загрузить файл PDF в недавно созданный каталог. Лист Excel содержит ссылку в виде:- www.xyz.com/filehandler/filedisplay.aspx?fn=blahblahblahh&fname=ContractingCompanyname Таким образом, пришлось добавить к нему "https://", прежде чем использовать его в функции загрузки файла. Кроме того, приведенная выше ссылка относится к защищенному сайту моей компании, который при запуске вручную загружает файл PDF.

Моя проблема в том, что PDF-файл загружен. Тем не менее он выдает ошибку при открытии файла, который представляет собой изображение ошибки открытия файла PDF.

Я ссылался на многие сайты и использовал все, включая RCurl, curl, а также консоль R и R studio для запуска своего кода. Каждый раз, когда файл загружается, но при открытии выдает ту же ошибку.

Вот мой код

    ##Set the working directory
txtsrc<-"C:\\Users\\skrishnan\\Desktop\\HR needed\\text analysis proj\\pdf\\FirstAid"
setwd(txtsrc)

##make a vector of contractor's safety program's  raw txt file names
pdflist <- read.xlsx("Final results_6thjuly.xlsx",1)

##Check records
head(pdflist)
tail(pdflist)
colnames(pdflist)

##Check if docs folder exists
if (dir.exists("FirstAid_docs")=="FALSE"){
dir.create("FirstAid_docs")
}

##Change the working directory
newfolder<-c("FirstAid_docs")
newpath<-file.path(txtsrc,newfolder)
setwd(newpath)

##Check the present working directory
getwd()


## Create directories and download files
for( i in 1:length(pdflist[,c("ci_CompanyName")])){

    ##First delete the existing directories
    if(dir.exists(pdflist[,c("ci_CompanyName")][i])=="TRUE"){
        unlink(pdflist[,c("ci_CompanyName")][i], recursive = TRUE)
      }

    ##Create a new directory
    directoryname<-pdflist[,c("ci_CompanyName")][i]
    dir.create(directoryname,recursive = FALSE, mode = "644")


      ##Get the downloadable links
      link<-pdflist[,c("DocLink")][i]
        vallink<-c("https://")
        newlink<-paste0(vallink,link)
      stringlink<-as.character(newlink)
      pdffilename<-paste0(strsplit(stringlink,"&fname=")[[1]][2],".pdf")

      ##Set paths for the downloadble file
      newway<-file.path(newpath,directoryname)
      destfile<-paste(newway,pdffilename,sep="/")

      ##Download the file
      download.file(stringlink,destfile,mode="w",method="auto",quiet = FALSE, cacheOK = TRUE)

      ##Next record
      i<-i+1 
}

Несколько вещей, которые помогут понять код

        > R.Version()
    $`platform`
    [1] "x86_64-w64-mingw32"

    $arch
    [1] "x86_64"

    $os
    [1] "mingw32"

    $system
    [1] "x86_64, mingw32"

    $status
    [1] ""

    $major
    [1] "3"

    $minor
    [1] "5.0"

    $year
    [1] "2018"

    $month
    [1] "04"

    $day
    [1] "23"

    $`svn rev`
    [1] "74626"

    $language
    [1] "R"

    $version.string
    [1] "R version 3.5.0 (2018-04-23)"

    $nickname
    [1] "Joy in Playing"

> colnames(pdflist)
[1] "ci_CompanyID"   "ci_CompanyName" "ProgramScore"   "ID_DI"          "DocLink"   

Любая помощь с благодарностью.

0 ответов

Другие вопросы по тегам