2021-06-19 12:00:18
Извините, но не сейчас.. или Обнаружена, но не проиндексированаВ Google консоли есть 2 замечательных статуса индексации страниц (описание из справки Google):
Страница просканирована, но пока не проиндексирована. В дальнейшем она может быть проиндексирована, а может и остаться в текущем состоянии
Обнаружена, не проиндексирована. Это сообщение означает, что мы нашли страницу, но пока не добавили ее в индекс Google. Обычно это объясняется тем, что роботу Google не удалось просканировать сайт, поскольку это могло привести к чрезмерной загрузке ресурса, и сканирование было перенесено на более поздний срок.
С которым массово сталкиваются, в большей мере: - Новые сайты, которые впервые заходят в индекс и имеют сложности с уникальностью контента на страницах
- Габаритные сайты с большим количеством страниц, чаще однотипных (например, страницы карточек товаров)
- После массового изменения URL адресов (ситуация, в которой еще вчера страницы были в индексе, после смены - Гугл посчитал иначе)
- Сайты с большим количеством товаров Нет в наличии, Google также может отправлять их в этот статус
- Сайты с дублирующим контентом (не всегда в консоли дубликаты попадают именно в статус дублирующий контент).
Ближе к сути:
В 2019 году Джон Мюллер из Гугл оставил такой комментарий по теме:
Мы не обещаем обход и индексацию всего контента. В интернете куча всего, и было бы непрактично включать всё, мы должны расставить приоритеты. Это не означает, что со страницами что-то не то, наши алгоритмы не видят смысла включать все страницы с вашего сайта.Это нормально, позже возможны изменения, это не является признаком технической проблемы.Одним из выходов, в таких случаях, это сосредоточить свои усилия на содержании проиндексированных, объединить похожие страницы, удалить ненужные страницы, делать более уникальный и интересный контент на страницах вашего сайта (или все эти шаги).Так какой состав таблетки? Перед тем, как прописывать рецепт, нужно:
- Проанализировать консоль, по сути, нужно найти закономерности в исключенных страницах и понять, какой именно тип(ы) страниц уходят в этот статус.
- Выборочно проверить страницы через оператор site:, может быть ложная тревога и странички будут в индексе
- После чего, попытаться разглядеть, чем они отличаются от тех, которые зашли в индекс (и это может быть не так очевидно и просто)
- Посмотреть, как выглядят такие же страницы у ваших конкурентов.
Конечно же, в плане потенциального решения, речь идет именно о ситуации, в которой в этот статус попадают нужные вам страницы, а не мусор, который достаточно просто закрыть или не выполнять никаких действий. Например, если это страницы товаров, по которым есть микро НЧ запросы по артикулам и т.д. - проект может недополучать органику.
Решение состоит из 3 частей (на примере страниц товаров):1. Уникализирумем контент страниц путем шаблонизации и уник контента:
- Уникализировать URL (комментарий Джона Мюллера из этого поста: Google может «потеряться» в большом количестве сгенерированных страниц с похожими URL, например, различающихся регистром или атрибутами. Если на сайте действительно много дублированных URL, их индексация не требуется, переходите к следующему пункту.)
- Уникализировать заголовок H1, мета описание и title
- Наличие конкретики (цены и др. информации)
- Наличие полных технических характеристик
- Наличие фотографий продукта
- Какие инфоблоки дублируются на всех страницах (что нужно убрать/что нужно добавить)
- Какие блоки перелинковки размещены (например, есть ли блок Другие товары)
2. Сократить количество однотипных товаров, если это возможно
3. Время на переиндексацию
п.с. один из лучших материалов по теме тут
224 views09:00