Что такое кодирование чешских символов при загрузке из Интернета

Я загружаю страницу из Интернета в node.js, используя стандартный request библиотека и чешские символы обрабатываются некорректно.

я пытался utf-8, ISO-8859-1, latin1, latin2 и несколько других кодировок, которые были предложены другой страницей, но ничего не работает.

Вот код, который я использую:

const request = require("request-promise-native");
const iconv = require("iconv-lite");

async function run() {
  const data = await request({
    encoding: null,
    method: "GET",
    uri: "yourpage.com"
  });

  const body = iconv.decode(data, "ISO-8859-1");
  console.log(body);
}

run().catch(console.log);

1 ответ

Некоторые из чешских страниц закодированы в cp1250, попробуйте, и он должен работать, если все остальные кодировки не работают.

const request = require("request-promise-native");
const iconv = require("iconv-lite");

async function run() {
  const data = await request({
    encoding: null,
    method: "GET",
    uri: "yourpage.com"
  });

  const body = iconv.decode(data, "cp1250");
  console.log(body);
}

run().catch(console.log);

Другие вопросы по тегам