Как предотвратить попытки робота Google проверить внешние ссылки на изображения на веб-странице?

Консоль поиска Google сообщает об ошибках ссылок на неработающие изображения для некоторых страниц моего старого веб-сайта. Похоже, что многие из этих страниц не проиндексированы Google, и я подозреваю, что причиной могут быть неработающие ссылки.

Вот доказательство: в консоли я выбираю одну из страниц, на которой робот Googlebot обнаружил ошибку. Затем я нажимаю "Получить как Google", и появляется следующая ошибка: "Робот Google не может получить все ресурсы для этой страницы". В нем перечислены одна или несколько ссылок на внешние картинки со страницы, которые "не найдены". На самом деле, это правда, что некоторые внешние пути изображения нарушены.

Если я нажимаю "Просмотреть как результат поиска" для каждой дефектной страницы, на консоли обычно отображается пустая страница результатов поиска. Я предполагаю, что это означает, что эти страницы не были проиндексированы Google.

Вот проблема: исправление неправильного пути изображения может показаться легким, но в этом случае это не так. Мой веб-сайт содержит более 70000 страниц, данные из которых взяты из базы данных MySQL, содержащей сотни тысяч элементов. Каждая веб-страница имеет несколько изображений, связанных с веб-сайта поставщика продукта. Большинство изображений хранятся в папке изображений по умолчанию на веб-сайте поставщика, но некоторые изображения хранятся в других местах. Их местоположение не предсказуемо, и это вызывает проблему.

Эта проблема была предвидена с самого начала. Предполагая, что процент внешних путей к изображениям неизбежно будет нарушен, каждый путь уже закодирован с помощью следующего Javascript, чтобы скрыть любые некрасивые сообщения об ошибках:

<img src="http://www.product-supplier.com/default-image-folder/12345678.gif" alt="Image not available." onerror="javascript:this.style.display='none';" width="150">

Этот javascript позволяет правильно отображать все изображения продуктов на веб-странице, если их путь указан правильно. Но если путь к изображению неисправен, отображается только пробел. Визуально это приемлемо для людей, но робот Googlebot не понимает JavaScript, поэтому считает, что неработающая ссылка является обязательным ресурсом.

Вот мои вопросы: Есть ли способ предотвратить попытки робота Googlebot проверить все внешние ссылки на изображения? Могу ли я указать Googlebot, что внешние ссылки на изображения не имеют значения? Есть ли способ скрыть ссылки на изображения от Googlebot?

Если это правда, что Google имеет тенденцию не индексировать какую-либо страницу с неработающей ссылкой на внешнее изображение, то не будет ли он также индексировать страницу с неработающей ссылкой на внешний веб-сайт? Если это так, это создаст мощный стимул не ссылаться на внешние веб-страницы, поскольку мы не контролируем внешние веб-страницы, и они иногда удаляются.

Ограничения:

  • Поставщик не объясняет свои критерии хранения некоторых изображений своих продуктов в нестандартных местах на своем веб-сайте.
  • Поставщик не предоставляет ссылку для каждого изображения.
  • Учитывая огромное количество данных о продукте, не представляется возможным прочесать их, чтобы найти каждую отдельную неработающую ссылку.
  • Было бы невозможно разместить все изображения, относящиеся к постоянно меняющемуся каталогу продукции поставщика, поскольку для этого потребовалось бы слишком много постоянного обслуживания.
  • Поэтому процент ссылок на изображения всегда будет нарушен.
  • Мои веб-страницы генерируются программно из моей базы данных MySQL, которая регулярно обновляется новыми данными от поставщика.
  • Мои знания в области программирования ограничены некоторым PHP и очень мало JavaScript. Поэтому, пожалуйста, ответьте простыми словами. Благодарю.

0 ответов

Другие вопросы по тегам