Как написать trycatch в R
Я хочу написать trycatch
код для устранения ошибки при загрузке из Интернета.
url <- c(
"http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
"http://en.wikipedia.org/wiki/Xz")
y <- mapply(readLines, con=url)
Эти два утверждения выполняются успешно. Ниже я создаю несуществующий веб-адрес:
url <- c("xxxxx", "http://en.wikipedia.org/wiki/Xz")
url[1]
не существует. Как написать trycatch
цикл (функция), чтобы:
- Если URL неверный, вывод будет: "Веб-адрес неверный, не могу получить".
- Когда URL-адрес неправильный, код не останавливается, а продолжает загружаться до конца списка URL-адресов?
6 ответов
Ну тогда: добро пожаловать в мир R;-)
Ну вот
Настройка кода
urls <- c(
"http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
"http://en.wikipedia.org/wiki/Xz",
"xxxxx"
)
readUrl <- function(url) {
out <- tryCatch(
{
# Just to highlight: if you want to use more than one
# R expression in the "try" part then you'll have to
# use curly brackets.
# 'tryCatch()' will return the last evaluated expression
# in case the "try" part was completed successfully
message("This is the 'try' part")
readLines(con=url, warn=FALSE)
# The return value of `readLines()` is the actual value
# that will be returned in case there is no condition
# (e.g. warning or error).
# You don't need to state the return value via `return()` as code
# in the "try" part is not wrapped insided a function (unlike that
# for the condition handlers for warnings and error below)
},
error=function(cond) {
message(paste("URL does not seem to exist:", url))
message("Here's the original error message:")
message(cond)
# Choose a return value in case of error
return(NA)
},
warning=function(cond) {
message(paste("URL caused a warning:", url))
message("Here's the original warning message:")
message(cond)
# Choose a return value in case of warning
return(NULL)
},
finally={
# NOTE:
# Here goes everything that should be executed at the end,
# regardless of success or error.
# If you want more than one expression to be executed, then you
# need to wrap them in curly brackets ({...}); otherwise you could
# just have written 'finally=<expression>'
message(paste("Processed URL:", url))
message("Some other message at the end")
}
)
return(out)
}
Применение кода
> y <- lapply(urls, readUrl)
Processed URL: http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html
Some other message at the end
Processed URL: http://en.wikipedia.org/wiki/Xz
Some other message at the end
URL does not seem to exist: xxxxx
Here's the original error message:
cannot open the connection
Processed URL: xxxxx
Some other message at the end
Warning message:
In file(con, "r") : cannot open file 'xxxxx': No such file or directory
Исследуя выход
> head(y[[1]])
[1] "<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">"
[2] "<html><head><title>R: Functions to Manipulate Connections</title>"
[3] "<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\">"
[4] "<link rel=\"stylesheet\" type=\"text/css\" href=\"R.css\">"
[5] "</head><body>"
[6] ""
> length(y)
[1] 3
> y[[3]]
[1] NA
Дополнительные замечания
попробуй поймать
tryCatch
возвращает значение, связанное с выполнением expr
если нет ошибки или предупреждения. В этом случае конкретные возвращаемые значения (см. return(NA)
выше) может быть указан путем предоставления соответствующей функции-обработчика (см. аргументы error
а также warning
в ?tryCatch
). Это могут быть функции, которые уже существуют, но вы также можете определить их в tryCatch()
(как я делал выше).
Последствия выбора конкретных возвращаемых значений функций-обработчиков
Как мы уже указали, NA
должен быть возвращен в случае ошибки, третий элемент в y
является NA
, Если бы мы выбрали NULL
быть возвращаемым значением, длина y
был бы просто 2
вместо 3
как lapply()
будет просто "игнорировать" возвращаемые значения, которые NULL
, Также обратите внимание, что если вы не укажете явное возвращаемое значение через return()
, функции обработчика вернутся NULL
(т.е. в случае ошибки или условия предупреждения).
"Нежелательное" предупреждение
Как warn=FALSE
кажется, не имеет никакого эффекта, альтернативный способ подавления предупреждения (который в данном случае не представляет особого интереса) заключается в использовании
suppressWarnings(readLines(con=url))
вместо
readLines(con=url, warn=FALSE)
Несколько выражений
Обратите внимание, что вы также можете поместить несколько выражений в "часть фактических выражений" (аргумент expr
из tryCatch()
), если вы заключите их в фигурные скобки (как показано на рисунке finally
часть).
tryCatch
имеет немного сложную синтаксическую структуру. Однако, как только мы поймем 4 части, которые составляют полный вызов tryCatch, как показано ниже, становится легко запомнить:
expr: [Обязательно] R код (ы) для оценки
error: [Необязательно] Что должно работать, если при вычислении кодов в expr произошла ошибка
warning: [Необязательно] Что должно работать, если при вычислении кодов в expr возникло предупреждение
finally: [Необязательно] Что должно быть выполнено непосредственно перед завершением вызова tryCatch, независимо от того, успешно ли был выполнен expr, с ошибкой или с предупреждением
tryCatch(
expr = {
# Your code...
# goes here...
# ...
},
error = function(e){
# (Optional)
# Do this if an error is caught...
},
warning = function(w){
# (Optional)
# Do this if an warning is caught...
},
finally = {
# (Optional)
# Do this at the end before quitting the tryCatch structure...
}
)
Таким образом, игрушечный пример для вычисления лога значения может выглядеть так:
log_calculator <- function(x){
tryCatch(
expr = {
message(log(x))
message("Successfully executed the log(x) call.")
},
error = function(e){
message('Caught an error!')
print(e)
},
warning = function(w){
message('Caught an warning!')
print(w)
},
finally = {
message('All done, quitting.')
}
)
}
Сейчас работает три дела:
Действительный случай
log_calculator(10)
# 2.30258509299405
# Successfully executed the log(x) call.
# All done, quitting.
"Предупреждающий" случай
log_calculator(-10)
# Caught an warning!
# <simpleWarning in log(x): NaNs produced>
# All done, quitting.
Случай "ошибки"
log_calculator("log_me")
# Caught an error!
# <simpleError in log(x): non-numeric argument to mathematical function>
# All done, quitting.
Я написал о некоторых полезных случаях использования, которые я использую регулярно. Узнайте больше здесь: https://rsangole.netlify.com/post/try-catch/
Надеюсь, это полезно.
R использует функции для реализации блока try-catch:
Синтаксис выглядит примерно так:
result = tryCatch({
expr
}, warning = function(warning_condition) {
warning-handler-code
}, error = function(error_condition) {
error-handler-code
}, finally={
cleanup-code
})
В tryCatch() есть два "условия", которые могут быть обработаны: "предупреждения" и "ошибки". При написании каждого блока кода важно понимать состояние выполнения и область действия. @источник
Вот простой пример:
# Do something, or tell me why it failed
my_update_function <- function(x){
tryCatch(
# This is what I want to do.
# If executing more than one expression you need curly braces.
{
y = x * 2
return(y)
},
# ... but if an error occurs, tell me what happened:
error=function(error_message) {
message("My message is here!")
message("And below is the error message from R:")
message(error_message)
return(NA)
}
)
}
Если вы также хотите зафиксировать "предупреждение", просто добавьте warning=
похож на error=
часть.
Так как я потерял два дня своей жизни, пытаясь найти для tryCatch функцию irr, я решил поделиться своей мудростью (и тем, чего не хватает). FYI - irr - это актуальная функция от FinCal, в этом случае в некоторых случаях возникли ошибки на большом наборе данных.
Настройте tryCatch как часть функции. Например:
irr2 <- function (x) { out <- tryCatch(irr(x), error = function(e) NULL) return(out) }
Чтобы ошибка (или предупреждение) сработала, вам нужно создать функцию. Я изначально за ошибочную часть просто написал
error = return(NULL)
и ВСЕ значения вернулись к нулю.Не забудьте создать вспомогательный выход (как мой "out") и
return(out)
,
The purrr
пакет предоставляет альтернативные функции, которые могут быть более дружелюбны в настройке, чемtryCatch
. Из?safely
документации, они описываются как:
safely
: обернутая функция вместо этого возвращает a с компонентами и . Если произошла ошибка, является объектом и имеет значение по умолчанию (). Иначе ошибкаNULL
.: обернутая функция вместо этого возвращает
list
с компонентами,output
,messages
иwarnings
.: обернутая функция использует значение по умолчанию (
otherwise
) всякий раз, когда возникает ошибка.
Обратите внимание, что эти функции, в отличие отtryCatch()
, как ожидается, обертывают функцию , а не выражение, и возвращают измененную функцию. Для решения проблемы ОП, как указано, мы, вероятно, использовали бы и перенесли непосредственно, чтобы изменить ее.
url <- c(
"http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
"http://en.wikipedia.org/wiki/Xz",
"xxx")
library(purrr)
lapply(url, possibly(readLines, otherwise = "web URL is wrong, can't get"))
## with possibly, the error prints as a warning
## and the final value is the `otherwise` string
Но также обратите внимание, что мы могли бы создать модифицированную версиюreadLines
, такой какmy_readLines <- possibly(readLines, otherwise = "web URL is wrong, can't get")
который можно использовать в нескольких местах нашего кода.
Я иллюстрирую с помощьюpossibly
выше, но мы могли бы легко представить себе случаи, когда мы хотели бы использоватьsafely()
(после чего мы могли бы извлечьresult
компонент из каждого элемента списка, возможно, пропуская или иным образом обрабатывая элементы с непустымerror
компонент, возможно, даже обрабатывая их по-разному в зависимости от ошибки), илиquietly
который также фиксирует предупреждения и сообщения отдельно.