Краулинговый бюджет: что это и как его экономить
У поискового робота не безграничное время на ваш сайт: за один заход он обходит ограниченное число страниц. Это и есть краулинговый бюджет. Если робот тратит его на мусорные и дублирующие URL, важные страницы индексируются медленно или не попадают в поиск вовсе. Разберём, как не разбазаривать бюджет.
Что такое краулинговый бюджет
Краулинговый бюджет (crawl budget) — это количество страниц сайта, которое поисковый робот готов обойти за определённый период. Он зависит от авторитета сайта, скорости сервера и того, как часто обновляется контент. Робот не обходит весь сайт за раз: он выбирает, что скачать сейчас, а что отложить. Ваша задача — направить его на ценные страницы и не дать тратить заходы на бесполезные.
Кому это важно
Для маленького сайта (до нескольких сотен страниц) бюджет обычно не проблема — робот успевает обойти всё. Краулинговый бюджет критичен для больших сайтов: интернет-магазинов с тысячами карточек и фильтров, маркетплейсов, крупных каталогов и СМИ. Там мусорные URL легко съедают весь обход, и новые товары/статьи неделями ждут индексации.
На что робот тратит бюджет впустую
Как экономить краулинговый бюджет
- Закройте мусор в robots.txt. Страницы поиска, корзину, фильтры с параметрами, технические разделы — Disallow, чтобы робот туда не ходил.
- Уберите дубли. Для сортировок, UTM и пагинации используйте rel=canonical на основную версию; склейте www/без-www и http/https.
- Сократите редиректы. Никаких цепочек: сразу A→финал, один шаг 301.
- Почините 404 и битые ссылки. Робот не должен ходить по ссылкам в никуда.
- Дайте свежий sitemap.xml. С актуальными URL и lastmod — робот идёт по карте целенаправленно.
- Ускорьте сайт. Быстрый ответ сервера = больше страниц за заход.
- Сообщайте об изменениях через IndexNow. Новые и обновлённые страницы уходят на переобход сразу, не дожидаясь планового визита.
Чек-лист
- Мусорные URL (поиск, корзина, фильтры, UTM) закрыты в robots.txt
- Дубли склеены через canonical, www и http редиректятся 301
- Цепочки редиректов сокращены до одного шага
- 404 и битые ссылки устранены
- Актуальный sitemap.xml отправлен в Вебмастер/Search Console
- Сервер отвечает быстро (до ~1 сек)
- Изменения уходят на переобход через IndexNow
Коротко
Краулинговый бюджет — это сколько страниц робот обойдёт за заход. Для больших сайтов его легко растратить на дубли, параметры, редиректы, 404 и бесполезные страницы. Экономьте его: закрывайте мусор в robots.txt, склеивайте дубли через canonical, сокращайте редиректы, чините 404, давайте свежий sitemap, ускоряйте сервер и пушите изменения через IndexNow. Тогда робот тратит обход на ценные страницы, и они быстрее попадают в поиск.