Загрузка строк UTF-8 в Vertica
Я пытаюсь загрузить некоторые строки UTF-8 в базу данных Vertica, используя команду COPY, запускаемую клиентом Vertica (инструмент VSQL). К сожалению, из документов Vertica:
Драйверы не преобразуют загруженные данные, выполняя оператор COPY или COPY LOCAL.
Данные, которые я импортирую, выглядят так
\u00DCser entered \\t and \\n and \\r and \u0161 \u0111 \u017E \u010D \u0107 \u0160 \u0110 \u017D \u010C \u0106 \u00FC \u00F6 \u00E4 \u00DC \u00D6 \u00C4
Это просто набор некоторых символов и представляет одну импортируемую строку. У кого-нибудь есть идеи как это сделать? Конечно, есть возможность использовать магию sed-awk перед запуском команды COPY, если это необходимо.
1 ответ
Похоже, ваши данные не в формате utf-8, а в каком-то формате для печати в точках Unicode. Проверьте процесс извлечения и убедитесь, что ваши данные находятся в utf-8, и они будут нормально загружаться (символьные данные должны быть в utf-8 в vertica).