Ошибка в пакетном геокодировании с использованием R googleway
Не уверен, почему я продолжаю получать эту ошибку:
Ошибка в значении [3L]: Произошла ошибка при загрузке результатов. Пожалуйста, проверьте правильность следующего URL, введя его в браузер. Если он действителен, отправьте отчет об ошибке со ссылкой на этот URL-адрес (примечание: ваш ключ API был удален, поэтому вам необходимо добавить его обратно)
https://maps.googleapis.com/maps/api/geocode/json?&address=
#A look at my dataframe called subset:
ID<- c("XM-7393","XM-7138")
Address<- c("175 College St #450, Toronto, ON M5T 1P7" ,"250 College St, Toronto, ON M5T 1R8")
subset<-data.frame(ID,Address)
subset$Address<- as.character(subset$Address)
require(googleway) #using google to get coordinates
gkey<-"INSERT GOOGLE API KEY HERE" #google API Key needed to get lat/lon coordinates
#a lat and lon vector to store the coordinates from the geocode
lat = vector("numeric", length = nrow(subset))
lng = vector("numeric", length = nrow(subset))
#Function for batch geocoding a list of addresses in a dataframe
for (i in 1:nrow(subset)) {
coord = googleway::google_geocode(subset$Address[i], key=gkey)
if (coord$status == "OK") {
coord = googleway::geocode_coordinates(coord)
lat[i] = coord$lat[1] # sometimes returns multiple coordinates
lng[i] = coord$lng[1] # sometimes returns multiple coordinates
} else {
lat[i] = NA
lng[i] = NA
}
}
#adding the lat and lon coordinates to subset dataset
subset$lat = lat
subset$lng = lng
Хорошо, код выше работает! Но только если в наборе данных не так много наблюдений. Исходный набор данных, с которым я работал, имел 1000 наблюдений, и я знаю, что я не близок к своему пределу API. Так что я не уверен, почему это не сработает, если у меня есть набор данных наблюдений за 1000 человек.
ОТВЕТ: В некоторых адресных полях было указано "#" для обозначения номера устройства. Это необходимо удалить (см. Комментарий ниже!)
1 ответ
Вы хотите убедиться, что в ваших адресах нет недопустимых или зарезервированных символов, поскольку любые функции геокодирования будут использовать ваш текст для создания URL-адресов для запроса API геокодирования. google_geocode
само по себе не дает очень полезного сообщения об ошибке, но, посмотрев URL-адрес, который вы разместили выше, сообщение об ошибке показывает, что необходимые параметры не были включены.
В этом случае, #
имеет особое значение в URL, поэтому вы получите сообщение об ошибке. К вашему сведению, мой ключ Google API сохранен в качестве переменной среды GOOGLE_KEY
:
library(googleway)
Address <- c("175 College St #450, Toronto, ON M5T 1P7", "250 College St, Toronto, ON M5T 1R8")
set_key(Sys.getenv("GOOGLE_KEY"))
geocode_results <- lapply(Address, google_geocode)
sapply(geocode_results, function(x) x[["status"]])
#> [1] "OVER_QUERY_LIMIT" "OK"
Первый адрес имеет ошибку; он также имеет #
персонаж. Вокруг находятся списки зарезервированных символов, включая этот вопрос, не зависящий от языка. Используя шаблон регулярных выражений, я удаляю любые #
, (
, или же )
символы, которые могут быть в адресах, затем повторите попытку геокодирования.
clean_addresses <- gsub(pattern = "[#\\(\\)]", replacement = "", Address)
geocode_cleaned <- lapply(clean_addresses, google_geocode)
sapply(geocode_cleaned, function(x) x[["status"]])
#> [1] "OK" "OK"