Загрузка PDF с использованием RSelenium
Что я пытаюсь сделать с RSelenium
пакет есть,
Шаг:1 Доступ к веб-сайту - Мой поставщик электроэнергии
Шаг:2 Войдите в мою учетную запись, явно указав свое имя пользователя и пароль (по этой причине я не могу поделиться кодом)
Шаг:3 Я нажимаю "ПОСМОТРЕТЬ МОЙ БИЛЛ". Счет отображается в формате PDF.
Есть ли способ загрузить этот файл и сохранить в определенную папку? Когда я использовал download.file()
команда, это не сохраняет документ, скорее я получаю файл PDF 3 КБ, который я не могу открыть. Adobe Reader сообщает, что при чтении документа произошла ошибка.
Возможный метод, который я попробовал: 1. Щелкните правой кнопкой мыши, нажмите стрелку вниз четыре раза и затем перейдите к "SAVE PAGE AS", нажмите Enter.
Но затем появляется диалоговое окно с запросом имени файла и местоположения, и я не могу ввести эти данные через RSelenium и сохранить файл.
Пример кода: какой-то случайный PDF-файл найден в Интернете.
url<- "http://www.immigrationpolicy.org/sites/default/files/docs/how_us_immig_system_works.pdf"
setwd("C:/Users/king/Desktop/bill")
library(RSelenium)
library(downloader)
checkForServer()
startServer()
remDr <- remoteDriver()
remDr$open()
remDr$navigate(url)
1 ответ
Я нашел ответ на постоянное исследование.
Сначала проверьте, установлен ли Rtools (нашел ответ по этой ссылке)
Затем обновил мою программу
`cprof<-makeFirefoxProfile(list(
"pdfjs.disabled"=TRUE,
"plugin.scan.plid.all" = FALSE,
"plugin.scan.Acrobat" = "99.0",
"browser.helperApps.neverAsk.saveToDisk"='application/pdf',
))
remDr <- remoteDriver(extraCapabilities=cprof)`
Попытка еще изменить папку загрузки, которую я пока не могу найти. Я нашел ответ по этой ссылке