Классифицировать значения, представленные в одном столбце, используя SQL, в их соответствующие типы данных?
Я пытался классифицировать набор значений, присутствующих в одном столбце (так же, как и выше) в типы данных. Проблема в том, что я использую среду Aster SQL (доступность функции и среды в целом очень ограничена). Другая проблема в том, что в столбце много ненужных значений, много символов, символов и т. Д., Что затрудняет даже жесткое кодирование проблемы. Структура примерно такая:
FeatureValue
123
24
15.6
17:15
abc
12/18/2014
17/222222
abc1200
001001oo
positve+
+1
Я хотел бы, чтобы решение было SQL-запросом. Конечный результат должен быть примерно таким:
FeatureValue Type
123 Numeric
24 Numeric
15.6 Numeric
17:15 String (?time)
abc String
12/18/2014 Date
17/222222 String
abc1200 String
001001oo String
positve+ String
+1 String
Я немного закодировал, но это решение не очень надежное. То, что я сделал, было:
case
when upper(trim(feature_value)) not like '%A%' and
upper(trim(feature_value)) not like '%B%' and
upper(trim(feature_value)) not like '%C%' and
upper(trim(feature_value)) not like '%D%' and
upper(trim(feature_value)) not like '%E%' and
upper(trim(feature_value)) not like '%F%' and
upper(trim(feature_value)) not like '%G%' and
upper(trim(feature_value)) not like '%H%' and
upper(trim(feature_value)) not like '%I%' and
upper(trim(feature_value)) not like '%J%' and
upper(trim(feature_value)) not like '%K%' and
upper(trim(feature_value)) not like '%L%' and
upper(trim(feature_value)) not like '%M%' and
upper(trim(feature_value)) not like '%N%' and
upper(trim(feature_value)) not like '%O%' and
upper(trim(feature_value)) not like '%P%' and
upper(trim(feature_value)) not like '%Q%' and
upper(trim(feature_value)) not like '%R%' and
upper(trim(feature_value)) not like '%S%' and
upper(trim(feature_value)) not like '%T%' and
upper(trim(feature_value)) not like '%U%' and
upper(trim(feature_value)) not like '%V%' and
upper(trim(feature_value)) not like '%W%' and
upper(trim(feature_value)) not like '%X%' and
upper(trim(feature_value)) not like '%Y%' and
upper(trim(feature_value)) not like '%Z%' and
upper(trim(feature_value)) <>'' and
upper(trim(feature_value)) not like '%+%' and
upper(trim(feature_value)) is not null and
--upper(trim(feature_value))<>'-' and
upper(trim(feature_value))<>'NULL' and
upper(trim(feature_value)) not like '%/%' and
upper(trim(feature_value)) not like '%-%' and
upper(trim(feature_value)) not like '%:%' and
feature_value is not null
then 'NUMERIC'
else 'STRING'
end as value_type
1 ответ
Решение
Вы можете попытаться получить немного больше контроля над CASE-кошмаром с помощью диапазона символов в LIKE-выражении:
CASE WHEN upper(trim(feature_value)) NOT LIKE '%[A-Z/-+:]%'
AND upper(trim(feature_value)) NOT LIKE ''
AND upper(trim(feature_value)) IS NOT NULL
THEN 'NUMERIC'
ELSE 'STRING'
END AS value_type
Изменить / расширить по мере необходимости.