Преобразование из Windows-1255 в UTF-8 в узле JS
Я извлекаю текст из веб-страницы в кодировке Windows-1255, используя Node.js. Я пытаюсь декодировать текст, используя следующий кодировщик / декодер Windows-1255: https://www.npmjs.com/package/windows-1255
После установки с помощью NPM и необходимости в соответствующем файле я попытался использовать его следующим образом:
var title = windows1255.decode('#title').text());
Это, кажется, не имеет никакого эффекта. Есть идеи, почему?
Спасибо!
Maor
1 ответ
Не знаю, ожидаете ли вы ответа на этот вопрос, но у меня сработало следующее...
При получении данных (файла) я установил параметры получения кодировки в двоичном виде:
var options = {
method: 'GET',
url: 'myURL',
encoding: 'binary'
};
request(options, function (error, response, body) {
//deal with hebrew encoding
csvString = encoding.convert(body, 'UTF8', "CP1255").toString();
Тогда я переключаю кодировку с CP1255
знак равноwindows1255
) чтобы UTF8
,
Надеюсь, поможет:)