notepad ++ показывает ucs-2LE, в то время как Ubuntu FILE [файл] показывает UTF-16LE, я запутался?

Я пытаюсь преобразовать файл, созданный из mssql до utf-8. Когда я открываю вывод он mssql использование notepad++ в Windows Server 2003 распознает файл как UCS-2LE Я скопировал файл на машину с Ubuntu, используя file [file] это показывает, что кодировка UTF-16LE, Действительно запутанный, должно быть некоторое различие в кодировке, поскольку имена отличаются. Но почему я вижу это в том же файле. Это .csv файл, сгенерированный из запроса mssql.

1 ответ

По большей части UTF-16 и UCS-2 - это одно и то же. Нет никакой разницы.

Это означает, что каждый символ имеет ширину два байта. "LE" означает " младший", то есть каждый двухбайтовый символ сначала сохраняется младшим байтом.

Если вы хотите конвертировать в UTF-8, в Notepad++ нажмите Convert to UTF-8 в меню Кодировка, затем сохраните.

Если после этого другие программы задыхаются от файла или в начале файла появляются два символа мусора, нажмите кнопку Convert to UTF-8 without BOM вместо.

Другие вопросы по тегам