Кодировка строки UTF-8 с кириллицей в H2O
Я загружаю CSV-файл в кодировке UTF-8 с кириллическими строками. После синтаксического анализа в интерфейсе Flow - я вижу не кириллические, но не читаемые символы, такие как "как". Как я могу использовать строки кириллицы utf-8 в H2O?
2 ответа
Это похоже на ошибку в интерфейсе Flow, но только в команде setupParse. Если вы продолжите и выполните импорт, данные будут импортированы правильно.
Я сообщил об ошибке с тестовыми данными и скриншотами (снятыми в Firefox) здесь:
https://0xdata.atlassian.net/browse/PUBDEV-4640
Так что, если у вас есть дополнительная информация, или ошибка ведет себя по-другому для вас, было бы хорошо добавить ее в отчет об ошибке.
Проверьте ваш CSV-файл в текстовом и двоичном представлении, чтобы узнать, как кодируется кириллический текст, если это UTF-8, он должен выглядеть следующим образом:
& # 1 055; & # 1088; & # 1080; & # 1 074; & # 1077; & # 1090;
для слова
Привет