Описание тега google-search

Описание тега Вопросы с тегом

ОПТИМИЗАЦИЯ ПОИСКОВОГО ДВИГАТЕЛЯ (SEO) НЕПОПУЛЯРНА. Этот тег предназначен только для вопросов программирования о поисковой системе Google.

Google - самая популярная поисковая система в мире. Google Web Search API является устаревшим в пользу нового пользовательского поиска.

Поиск в Google может не возвращать ответы, которых можно было бы ожидать, по причинам, включая те, которые упомянуты в ответах и комментариях к Что вы НЕ можете найти в Google?:

Google даже не пытается

Чтобы найти ключевые слова со специальными символами:

"Как правило, знаки препинания игнорируются, включая @#$%^&*()=+[]\ и другие специальные символы", - Фрэнк Дернонкур.

Поисковый запрос double unary работает, но не --. См. Также Google отображает мой веб-сайт как орфографическую ошибку.

Сайты со слишком большим количеством контента, малоценным или непрактичным для индексации

Может включать:

Сайты, которые не имеют доступной для сканирования карты и требуют от Google предоставления условий поиска для доступа к результатам, доступным на сайте, могут быть не полностью проиндексированы. -Жозефина Бонапарт
Блоги меньшего размера, которые не обновляются регулярно, часто удаляются из результатов поиска. Плюс ко всему, что они считают сплогом ("блог, который автор использует для продвижения связанных сайтов" - Википедия). -Дэвид
"Большая часть контента Twitter не индексируется Google, даже если он общедоступен.
Раньше он был доступен для Google, но теперь это не так, поскольку срок их соглашения истек ". -Алекс
"Google не так хорошо индексирует Tumblr.
Сообщения в блогах на Tumblr легче найти с помощью поиска Tumblr ". -Дэвид
"Все на сайтах Google не индексируется (или почти не индексируется).
Если вы создаете сайт Google, получите свой собственный домен ". -Дэвид

Авторские права и другие защищенные материалы

Может включать:

То, что думает правительство, плохо для вас. –Hellagot
Приведенный пример был из Германии, "не показывает тысячи сайтов… и список увеличивается на тысячи каждый год".
Что может нарушать права интеллектуальной собственности. –Einpoklum
DMCA (Закон об авторском праве в цифровую эпоху) был упомянут.
Изображения переписи.
"Поскольку контент представляет собой изображения, которые часто индексируются вручную, их обычно можно найти на платных сайтах, таких как ancestry.com". –Amh

Чтобы узнать, сканирование каких URL-адресов было заблокировано Google, посетите страницу "Заблокированные URL-адреса" в разделе "Сканирование" Инструментов для веб-мастеров.

Отказаться

Контент, явно запрещенный файлом robots.txt домена, исключается из индекса Google. -amh

Технические сложности

Веб-сайты, на которые не ссылаются другие веб-сайты, которые уже известны Google (возможно, когда домен находился под другим владельцем - Тим Пост). То есть, вероятно, существует множество веб-сайтов, на которые не ссылаются видимые страницы, эти веб-сайты никогда не будут обнаружены пауком Google, если они не отправлены в Google вручную через Инструменты для веб-мастеров. –Amh
Веб-сайты, скрытые за веб-формами, которые вам необходимо заполнить. –Amh
Deep Web "Большая часть информации Паутины похоронен далеко вниз на динамически создаваемых сайтах, и стандартные поисковые системы не находят его. Традиционные поисковые системы не могут "видеть" или извлекать контент в глубокой сети - эти страницы не существуют до тех пор, пока они не создаются динамически в результате определенного поиска. По состоянию на 2001 год глубокая паутина была на несколько порядков больше, чем поверхностная сеть ". -Википедия
По данным Wayback Machine, может включать 408 миллиардов веб-страниц, сохраненных с течением времени. –Гайки