Преобразование из Windows-1255 в UTF-8 в узле JS

Я извлекаю текст из веб-страницы в кодировке Windows-1255, используя Node.js. Я пытаюсь декодировать текст, используя следующий кодировщик / декодер Windows-1255: https://www.npmjs.com/package/windows-1255

После установки с помощью NPM и необходимости в соответствующем файле я попытался использовать его следующим образом:

var title = windows1255.decode('#title').text());

Это, кажется, не имеет никакого эффекта. Есть идеи, почему?

Спасибо!

Maor

1 ответ

Не знаю, ожидаете ли вы ответа на этот вопрос, но у меня сработало следующее...

При получении данных (файла) я установил параметры получения кодировки в двоичном виде:

var options = {
        method: 'GET',
        url: 'myURL',
        encoding: 'binary' 
    };

    request(options, function (error, response, body) {

        //deal with hebrew encoding
        csvString = encoding.convert(body, 'UTF8', "CP1255").toString();

Тогда я переключаю кодировку с CP1255 знак равноwindows1255) чтобы UTF8,

Надеюсь, поможет:)

Другие вопросы по тегам