Неправильно сформированный HTML-контент с помощью Puppeteer и Nodejs

Я пытаюсь получить содержимое страницы с помощью Pupperteer и Nodejs, но по какой-то причине вывод html отличается от исходного. Например, это мой код:

      'use strict';
var amphtmlValidator = require('amphtml-validator');

const puppeteer = require('puppeteer');

amphtmlValidator.getInstance().then(async function (validator) {
    const browser = await puppeteer.launch({ headless: true, args: ['--no-sandbox'] });
    const page = await browser.newPage();

    await page.goto('https://amp.dev/documentation/examples/e-commerce/product_browse_page/preview/?format=websites', {
        waitUntil: "networkidle0", 
    });
    const content= await page.content();
...

когда я печатаю переменную содержимого, я получаю следующее:

      <!DOCTYPE html><html amp="" lang="en" i-amphtml-layout="" i-amphtml-no-boilerplate="" 
transformed="self;v=1" amp-version="2103060631004" class="i-amphtml-singledoc i-amphtml-standalone">
<head><meta charset="utf-8"><style amp-runtime=""... etc

и если мы перейдем к источнику, мы увидим, что теги разные: https://amp.dev/documentation/examples/e-commerce/product_browse_page/preview/?format=websites

      <!DOCTYPE HTML><html amp lang="en" i-amphtml-layout i-amphtml-no-boilerplate transformed="self;v=1">
<head><meta charset="utf-8"><style amp-runtime... etc

то я не могу передать валидатор AMP с выводом, который я получил от Puppeteer:

https://validator.ampproject.org/

мне нужно, чтобы вывод Puppeteer в переменной содержимого печатался так же, как исходный код страницы

0 ответов

Другие вопросы по тегам