Насколько детальной должна быть моя карта сайта для многоязычного сайта?

У меня есть одностраничный веб-сайт, который включает главную страницу на английском языке и главную страницу на французском языке. Можно получить доступ к моему веб-сайту через следующие URL:

АНГЛИЙСКАЯ ВЕРСИЯ ГЛАВНОЙ СТРАНИЦЫ

  • www.example.org
  • www.example.org/index.html
  • example.org
  • example.org/index.html

ФРАНЦУЗСКАЯ ВЕРСИЯ ГЛАВНОЙ СТРАНИЦЫ

  • www.example.org/fr
  • www.example.org/fr/index.html
  • example.org/fr
  • example.org/fr/index.html

Для оптимальной индексации поисковой системы, я должен включить все эти URL в мою карту сайта (с обоими http:// а также https://)? Если нет, какой набор URL я должен включить в мой файл sitemap.xml?

2 ответа

Вы должны включить все уникальные страницы в вашу карту сайта один раз.

Все перечисленные вами URL-адреса - это просто разные способы доступа к одной и той же странице / содержимому, так же как к большинству PHP-приложений можно получить доступ через site.org/ или же site.org/index.php, Ваша карта сайта должна содержать только одну ссылку на страницу.

Лучше всего иметь один канонический URL на каждый документ. И каждый канонический URL должен быть добавлен в вашу карту сайта (если он у вас есть).

Поэтому в вашем случае вы можете использовать один URL-адрес для главной страницы на английском языке и один URL-адрес для главной страницы на французском языке и перенаправить (с кодом состояния HTTP 301) с других URL-адресов на канонические. Кроме того, вы можете объявить канонический URL с помощью canonical отношение ссылки.

Если вам нужно предоставить HTTP в дополнение к HTTPS (вместо принудительного применения HTTPS), вам, конечно, нужно иметь два URL-адреса на документ (один с HTTP, другой с HTTPS). Но вы должны перечислить только один вариант в карте сайта, и вы должны объявить только один вариант canonical (в идеале то же самое, что вы добавили в карту сайта).

Какие URL-адреса выбрать, может зависеть от различных факторов (юзабилити, SEO, ваш бэкэнд, …), но, кажется, можно предположить, что index.html это балласт. Вы должны решить, использовать ли www поддомен ( общее соглашение) или нет. Предполагая, что вы решите опустить его, у вас могут быть следующие канонические URL:

https://example.org/
https://example.org/fr

И вы перенаправили бы следующие URL-адреса с 301 на канонические URL-адреса, перечисленные выше:

https://example.org/index.html
https://www.example.org/
https://www.example.org/index.html
https://example.org/fr/index.html
https://www.example.org/fr
https://www.example.org/fr/index.html
Другие вопросы по тегам