Неправильно сформированный HTML-контент с помощью Puppeteer и Nodejs
Я пытаюсь получить содержимое страницы с помощью Pupperteer и Nodejs, но по какой-то причине вывод html отличается от исходного. Например, это мой код:
'use strict';
var amphtmlValidator = require('amphtml-validator');
const puppeteer = require('puppeteer');
amphtmlValidator.getInstance().then(async function (validator) {
const browser = await puppeteer.launch({ headless: true, args: ['--no-sandbox'] });
const page = await browser.newPage();
await page.goto('https://amp.dev/documentation/examples/e-commerce/product_browse_page/preview/?format=websites', {
waitUntil: "networkidle0",
});
const content= await page.content();
...
когда я печатаю переменную содержимого, я получаю следующее:
<!DOCTYPE html><html amp="" lang="en" i-amphtml-layout="" i-amphtml-no-boilerplate=""
transformed="self;v=1" amp-version="2103060631004" class="i-amphtml-singledoc i-amphtml-standalone">
<head><meta charset="utf-8"><style amp-runtime=""... etc
и если мы перейдем к источнику, мы увидим, что теги разные: https://amp.dev/documentation/examples/e-commerce/product_browse_page/preview/?format=websites
<!DOCTYPE HTML><html amp lang="en" i-amphtml-layout i-amphtml-no-boilerplate transformed="self;v=1">
<head><meta charset="utf-8"><style amp-runtime... etc
то я не могу передать валидатор AMP с выводом, который я получил от Puppeteer:
https://validator.ampproject.org/
мне нужно, чтобы вывод Puppeteer в переменной содержимого печатался так же, как исходный код страницы