Почему Google индексирует страницы, указанные в файле robots.txt

01.04.2019 Комментарии к записи Почему Google индексирует страницы, указанные в файле robots.txt отключены 529 Просмотров

От автора: Google может проиндексировать веб-страницу, даже если она заблокирована в файле robots.txt. Об этом рассказал представитель поисковой системы Джон Мюллер.

Инженер Google, отвечая на вопрос, заданный вебмастером в Twitter, разъяснил, что поисковый робот умеет индексировать даже те страницы, которые заблокированы в robots.txt. При этом Googlebot четко придерживается установленных в данном файле ограничений и не сканирует содержимое заблокированных разделов.

Первоначально вебмастер попросил пояснить Мюллера, почему в поисковой выдаче отображаются адреса и заголовки страниц ресурса, сканирование которого полностью запрещено в robots.txt. На что Джон ответил, что URL могут индексироваться даже в том случае, если они внесены в этот файл. Для представления заблокированных страниц поисковик использует ссылки. Из них Google формирует заголовки для выдачи.

Другой эксперт отрасли Барри Адамс, участвующий в обсуждении, добавил, что для запрета индексации следует использовать другие средства. Например, заголовки X-Robots-Tag.

Источник: https://www.searchengines.ru

Все про сайтостроение

Почему Google индексирует страницы, указанные в файле robots.txt

Похожие

Апрель 2024
Пн	Вт	Ср	Чт	Пт	Сб	Вс
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30