Что такое кодирование чешских символов при загрузке из Интернета
Я загружаю страницу из Интернета в node.js, используя стандартный request
библиотека и чешские символы обрабатываются некорректно.
я пытался utf-8
, ISO-8859-1
, latin1
, latin2
и несколько других кодировок, которые были предложены другой страницей, но ничего не работает.
Вот код, который я использую:
const request = require("request-promise-native");
const iconv = require("iconv-lite");
async function run() {
const data = await request({
encoding: null,
method: "GET",
uri: "yourpage.com"
});
const body = iconv.decode(data, "ISO-8859-1");
console.log(body);
}
run().catch(console.log);
1 ответ
Некоторые из чешских страниц закодированы в cp1250
, попробуйте, и он должен работать, если все остальные кодировки не работают.
const request = require("request-promise-native");
const iconv = require("iconv-lite");
async function run() {
const data = await request({
encoding: null,
method: "GET",
uri: "yourpage.com"
});
const body = iconv.decode(data, "cp1250");
console.log(body);
}
run().catch(console.log);