Преобразование Юникода в shiftJIS
У меня есть японский клиент, и я сгенерировал большой плоский файл (1,2 миллиона строк) для отправки на него.
Файл имеет кодировку UTF-8, которая поддерживает хранение и отображение всех японских символов. Клиент желает получить этот файл в формате ShiftJIS, который предназначен для японских символов.
- Со страницы википедии я могу получить логику преобразования
- Я вижу онлайн-конвертеры, такие как motobit, которые позволяют вам конвертировать кодировки.
Моя проблема в том, что мой файл довольно большой, и мне придется сделать это еще несколько сотен файлов. Поле копирования и вставки в онлайн-конвертере не масштабируется до такого размера и недостаточно быстро.
Кто-нибудь знает о бесплатном настольном приложении или, возможно, даже о рубиновой библиотеке, которую я мог бы использовать для преобразования кодировок? Или какие-либо другие предложения?
Спасибо!
2 ответа
Я думаю, что вы хотите, может быть nkf
, Сетевой фильтр кандзи.
Вы можете преобразовать файл из utf-8 в shift-jis следующим образом:
% nkf -s file-utf8.txt > file-sjis.txt
страница справочника:
http://linuxcommand.org/man_pages/nkf1.html
википедия:
http://en.wikipedia.org/wiki/Network_Kanji_Filter
Вы можете установить nkf следующим образом:
% sudo yum install nkf
% sudo port install nkf
% brew install nkf
Надеюсь это поможет.
Нет необходимости в каком-либо инструменте или утилите, просто используйте gedit для конвертации ваших файлов. Выполняет шаги, указанные ниже:
Откройте ваш файл в gedit, который вы хотите конвертировать, в любом формате.
Скопируйте все содержимое файла и вставьте новый документ gedit.
Теперь сохраните файл. В открывшемся диалоговом окне сохранения выберите кодировку символов как SHIFT_JIS перед сохранением файла, к этому прилагается скриншот ниже: Измените окончание строки, если хотите. Если вы не видите SHIFT_JIS в опциях выбора, нажмите кнопку "Добавить" или "Удалить", которая находится прямо под ним.
В открывшемся диалоговом окне выберите SHIFT_JIS из доступных кодировок в левом столбце и нажмите кнопку "Добавить". После добавления в меню кодирования выберите его и сохраните.