Как написать trycatch в R

Я хочу написать trycatch код для устранения ошибки при загрузке из Интернета.

url <- c(
    "http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
    "http://en.wikipedia.org/wiki/Xz")
y <- mapply(readLines, con=url)

Эти два утверждения выполняются успешно. Ниже я создаю несуществующий веб-адрес:

url <- c("xxxxx", "http://en.wikipedia.org/wiki/Xz")

url[1] не существует. Как написать trycatch цикл (функция), чтобы:

  1. Если URL неверный, вывод будет: "Веб-адрес неверный, не могу получить".
  2. Когда URL-адрес неправильный, код не останавливается, а продолжает загружаться до конца списка URL-адресов?

6 ответов

Решение

Ну тогда: добро пожаловать в мир R;-)

Ну вот

Настройка кода

urls <- c(
    "http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
    "http://en.wikipedia.org/wiki/Xz",
    "xxxxx"
)
readUrl <- function(url) {
    out <- tryCatch(
        {
            # Just to highlight: if you want to use more than one 
            # R expression in the "try" part then you'll have to 
            # use curly brackets.
            # 'tryCatch()' will return the last evaluated expression 
            # in case the "try" part was completed successfully

            message("This is the 'try' part")

            readLines(con=url, warn=FALSE) 
            # The return value of `readLines()` is the actual value 
            # that will be returned in case there is no condition 
            # (e.g. warning or error). 
            # You don't need to state the return value via `return()` as code 
            # in the "try" part is not wrapped insided a function (unlike that
            # for the condition handlers for warnings and error below)
        },
        error=function(cond) {
            message(paste("URL does not seem to exist:", url))
            message("Here's the original error message:")
            message(cond)
            # Choose a return value in case of error
            return(NA)
        },
        warning=function(cond) {
            message(paste("URL caused a warning:", url))
            message("Here's the original warning message:")
            message(cond)
            # Choose a return value in case of warning
            return(NULL)
        },
        finally={
        # NOTE:
        # Here goes everything that should be executed at the end,
        # regardless of success or error.
        # If you want more than one expression to be executed, then you 
        # need to wrap them in curly brackets ({...}); otherwise you could
        # just have written 'finally=<expression>' 
            message(paste("Processed URL:", url))
            message("Some other message at the end")
        }
    )    
    return(out)
}

Применение кода

> y <- lapply(urls, readUrl)
Processed URL: http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html
Some other message at the end
Processed URL: http://en.wikipedia.org/wiki/Xz
Some other message at the end
URL does not seem to exist: xxxxx
Here's the original error message:
cannot open the connection
Processed URL: xxxxx
Some other message at the end
Warning message:
In file(con, "r") : cannot open file 'xxxxx': No such file or directory

Исследуя выход

> head(y[[1]])
[1] "<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">"      
[2] "<html><head><title>R: Functions to Manipulate Connections</title>"      
[3] "<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\">"
[4] "<link rel=\"stylesheet\" type=\"text/css\" href=\"R.css\">"             
[5] "</head><body>"                                                          
[6] ""    

> length(y)
[1] 3

> y[[3]]
[1] NA

Дополнительные замечания

попробуй поймать

tryCatch возвращает значение, связанное с выполнением expr если нет ошибки или предупреждения. В этом случае конкретные возвращаемые значения (см. return(NA) выше) может быть указан путем предоставления соответствующей функции-обработчика (см. аргументы error а также warning в ?tryCatch). Это могут быть функции, которые уже существуют, но вы также можете определить их в tryCatch() (как я делал выше).

Последствия выбора конкретных возвращаемых значений функций-обработчиков

Как мы уже указали, NA должен быть возвращен в случае ошибки, третий элемент в y является NA, Если бы мы выбрали NULL быть возвращаемым значением, длина y был бы просто 2 вместо 3 как lapply() будет просто "игнорировать" возвращаемые значения, которые NULL, Также обратите внимание, что если вы не укажете явное возвращаемое значение через return(), функции обработчика вернутся NULL (т.е. в случае ошибки или условия предупреждения).

"Нежелательное" предупреждение

Как warn=FALSE кажется, не имеет никакого эффекта, альтернативный способ подавления предупреждения (который в данном случае не представляет особого интереса) заключается в использовании

suppressWarnings(readLines(con=url))

вместо

readLines(con=url, warn=FALSE)

Несколько выражений

Обратите внимание, что вы также можете поместить несколько выражений в "часть фактических выражений" (аргумент expr из tryCatch()), если вы заключите их в фигурные скобки (как показано на рисунке finally часть).

tryCatch имеет немного сложную синтаксическую структуру. Однако, как только мы поймем 4 части, которые составляют полный вызов tryCatch, как показано ниже, становится легко запомнить:

expr: [Обязательно] R код (ы) для оценки

error: [Необязательно] Что должно работать, если при вычислении кодов в expr произошла ошибка

warning: [Необязательно] Что должно работать, если при вычислении кодов в expr возникло предупреждение

finally: [Необязательно] Что должно быть выполнено непосредственно перед завершением вызова tryCatch, независимо от того, успешно ли был выполнен expr, с ошибкой или с предупреждением

tryCatch(
    expr = {
        # Your code...
        # goes here...
        # ...
    },
    error = function(e){ 
        # (Optional)
        # Do this if an error is caught...
    },
    warning = function(w){
        # (Optional)
        # Do this if an warning is caught...
    },
    finally = {
        # (Optional)
        # Do this at the end before quitting the tryCatch structure...
    }
)

Таким образом, игрушечный пример для вычисления лога значения может выглядеть так:

log_calculator <- function(x){
    tryCatch(
        expr = {
            message(log(x))
            message("Successfully executed the log(x) call.")
        },
        error = function(e){
            message('Caught an error!')
            print(e)
        },
        warning = function(w){
            message('Caught an warning!')
            print(w)
        },
        finally = {
            message('All done, quitting.')
        }
    )    
}

Сейчас работает три дела:

Действительный случай

log_calculator(10)
# 2.30258509299405
# Successfully executed the log(x) call.
# All done, quitting.

"Предупреждающий" случай

log_calculator(-10)
# Caught an warning!
# <simpleWarning in log(x): NaNs produced>
# All done, quitting.

Случай "ошибки"

log_calculator("log_me")
# Caught an error!
# <simpleError in log(x): non-numeric argument to mathematical function>
# All done, quitting.

Я написал о некоторых полезных случаях использования, которые я использую регулярно. Узнайте больше здесь: https://rsangole.netlify.com/post/try-catch/

Надеюсь, это полезно.

R использует функции для реализации блока try-catch:

Синтаксис выглядит примерно так:

result = tryCatch({
    expr
}, warning = function(warning_condition) {
    warning-handler-code
}, error = function(error_condition) {
    error-handler-code
}, finally={
    cleanup-code
})

В tryCatch() есть два "условия", которые могут быть обработаны: "предупреждения" и "ошибки". При написании каждого блока кода важно понимать состояние выполнения и область действия. @источник

Вот простой пример:

# Do something, or tell me why it failed
my_update_function <- function(x){
    tryCatch(
        # This is what I want to do.
        # If executing more than one expression you need curly braces.
        {
        y = x * 2
        return(y)
        },
        # ... but if an error occurs, tell me what happened: 
        error=function(error_message) {
            message("My message is here!")
            message("And below is the error message from R:")
            message(error_message)
            return(NA)
        }
    )
}

Если вы также хотите зафиксировать "предупреждение", просто добавьте warning= похож на error= часть.

Так как я потерял два дня своей жизни, пытаясь найти для tryCatch функцию irr, я решил поделиться своей мудростью (и тем, чего не хватает). FYI - irr - это актуальная функция от FinCal, в этом случае в некоторых случаях возникли ошибки на большом наборе данных.

  1. Настройте tryCatch как часть функции. Например:

    irr2 <- function (x) {
      out <- tryCatch(irr(x), error = function(e) NULL)
      return(out)
    }
    
  2. Чтобы ошибка (или предупреждение) сработала, вам нужно создать функцию. Я изначально за ошибочную часть просто написал error = return(NULL) и ВСЕ значения вернулись к нулю.

  3. Не забудьте создать вспомогательный выход (как мой "out") и return(out),

The purrrпакет предоставляет альтернативные функции, которые могут быть более дружелюбны в настройке, чемtryCatch. Из?safelyдокументации, они описываются как:

  • safely: обернутая функция вместо этого возвращает a с компонентами и . Если произошла ошибка, является объектом и имеет значение по умолчанию (). Иначе ошибкаNULL.

  • : обернутая функция вместо этого возвращаетlistс компонентами,output,messagesиwarnings.

  • : обернутая функция использует значение по умолчанию (otherwise) всякий раз, когда возникает ошибка.

Обратите внимание, что эти функции, в отличие отtryCatch(), как ожидается, обертывают функцию , а не выражение, и возвращают измененную функцию. Для решения проблемы ОП, как указано, мы, вероятно, использовали бы и перенесли непосредственно, чтобы изменить ее.

      url <- c(
    "http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
    "http://en.wikipedia.org/wiki/Xz", 
    "xxx")

library(purrr)
lapply(url, possibly(readLines, otherwise = "web URL is wrong, can't get"))
## with possibly, the error prints as a warning
## and the final value is the `otherwise` string

Но также обратите внимание, что мы могли бы создать модифицированную версиюreadLines, такой какmy_readLines <- possibly(readLines, otherwise = "web URL is wrong, can't get")который можно использовать в нескольких местах нашего кода.

Я иллюстрирую с помощьюpossiblyвыше, но мы могли бы легко представить себе случаи, когда мы хотели бы использоватьsafely()(после чего мы могли бы извлечьresultкомпонент из каждого элемента списка, возможно, пропуская или иным образом обрабатывая элементы с непустымerrorкомпонент, возможно, даже обрабатывая их по-разному в зависимости от ошибки), илиquietlyкоторый также фиксирует предупреждения и сообщения отдельно.

Другие вопросы по тегам