notepad ++ показывает ucs-2LE, в то время как Ubuntu FILE [файл] показывает UTF-16LE, я запутался?
Я пытаюсь преобразовать файл, созданный из mssql
до utf-8. Когда я открываю вывод он mssql
использование notepad++ в Windows Server 2003 распознает файл как UCS-2LE
Я скопировал файл на машину с Ubuntu, используя file [file]
это показывает, что кодировка UTF-16LE
, Действительно запутанный, должно быть некоторое различие в кодировке, поскольку имена отличаются. Но почему я вижу это в том же файле. Это .csv
файл, сгенерированный из запроса mssql.
1 ответ
По большей части UTF-16 и UCS-2 - это одно и то же. Нет никакой разницы.
Это означает, что каждый символ имеет ширину два байта. "LE" означает " младший", то есть каждый двухбайтовый символ сначала сохраняется младшим байтом.
Если вы хотите конвертировать в UTF-8, в Notepad++ нажмите Convert to UTF-8
в меню Кодировка, затем сохраните.
Если после этого другие программы задыхаются от файла или в начале файла появляются два символа мусора, нажмите кнопку Convert to UTF-8 without BOM
вместо.