Функция Readxl не может определить тип данных и выдает предупреждения после принудительной загрузки
Это мой код. У меня есть файл xlsx с несколькими листами, и я пытаюсь загрузить первый лист.
Я использовал RStudio Excel IDE для загрузки листа
Это сгенерировало приведенный ниже код, но оно рассматривало все атрибуты как символы, но оно должно было идентифицировать первый и четвертый как числовые, поэтому я изменил их вручную перед импортом.
> PharmacyMaster <- read_excel("~/Desktop/R/ABDataSet(WithDataSetMaster).xlsx",
+ sheet = "PHRMCY MASTER", col_types = c("numeric",
+ "text", "text", "numeric"))
Набор данных был импортирован, но я получил 50 предупреждений, на которые я не уверен, что они имеют в виду.
There were 50 or more warnings (use warnings() to see the first 50)
> View(PharmacyMaster)
> warnings()
Warning messages:
1: In read_fun(path = path, sheet = sheet, limits = limits, ... :
Coercing text to numeric in A2 / R2C1: '1017330163607345979'
2: In read_fun(path = path, sheet = sheet, limits = limits, ... :
Coercing text to numeric in D2 / R2C4: '070'
3: In read_fun(path = path, sheet = sheet, limits = limits, ... :
Coercing text to numeric in A3 / R3C1: '1041420479647471411'
4: In read_fun(path = path, sheet = sheet, limits = limits, ... :
Coercing text to numeric in D3 / R3C4: '071'
5: In read_fun(path = path, sheet = sheet, limits = limits, ... :
Coercing text to numeric in A4 / R4C1: '1048827871928328746'
Я проверил структуру моего загруженного набора данных,
> str(PharmacyMaster)
Classes ‘tbl_df’, ‘tbl’ and 'data.frame': 1097 obs. of 4 variables:
$ PHRMCY_NBR: num 1.02e+18 1.04e+18 1.05e+18 1.06e+18 1.06e+18 ...
$ PHRMCY_NAM: chr "GNP PHARMACY #1" "GNP PHARMACY #2" "GNP PHARMACY #3" "GNP PHARMACY #4" ...
$ ST_CD : chr "NJ" "NJ" "MA" "NJ" ...
$ ZIP_3_CD : num 70 71 21 70 100 11 70 193 75 70 ...
У меня есть два вопроса: 1. Почему readxl не может определить числовые столбцы и загрузить их как числовые, что видно на снимке экрана IDE. Я изменил его вручную. (Можно найти снимок набора данных ниже) 2. Что означают предупреждения?
PS В числовом столбце набора данных нет кавычек или пустых значений, для этого я вручную проверил все 1097 строк.