10 действенных способов заставить Google индексировать ваш сайт
Joshua Hardwick
Глава отдела контента в Ahrefs (проще говоря, я отвечаю за то, чтобы каждый пост в блоге был КРУТЫМ).
Статистика статьи
Ежемесячный трафик 440
Ссылающиеся веб-сайты 6
Данные из Контент Эксплорер
Показывает, сколько различных веб-сайтов ссылаются на этот контент. Как правило, чем больше сайтов ссылаются на вас, тем выше вы ранжируетесь в Google.
Показывает ежемесячный рассчетный поисковый трафик на эту статью по данным Ahrefs. Фактический поисковый трафик (по данным Google Analytics) обычно в 3–5 раз больше.
Количество ретвитов этой статьи в Twitter.
Поделиться этой статьей
Содержание
Если ваш сайт не индексируется Google, то он практически невидим. Он не будет попадать в результаты поиска и получать естественный трафик. Совсем. Вообще. Ничего.
Если вы читаете эту статью, то это вам уже и так известно. Так что перейдем сразу к делу.
Эта статья поможет вам решить три проблемы:
- Ваш сайт вообще не индексируется.
- Часть страниц сайта индексируется, а часть — нет.
- Свежеопубликованные статьи индексируются недостаточно быстро.
Но сперва давайте убедимся, что мы имеем в виду одно и то же, когда говорим об «индексировании».
Что такое краулинг и индексирование?
Google находит новые страницы при помощи паука, который ползает по Всемирной паутине («краулинг» дословно означает «ползание») и добавляет страницы в свою базу данных — индекс. Этот паук называется поисковым роботом, а у робота Google есть собственное имя — Гуглбот (Googlebot).
Запутались? Давайте дадим определения основным терминам.
- Краулинг — процесс перехода по гиперссылкам в Интернете с целью нахождения нового контента.
- Индексирование — процесс сохранения каждой веб-страницы в обширной базе данных.
- Поисковый робот — Программа, которая выполняет краулинг.
- Googlebot — поисковый робот Google.
Вот видео от Google, в котором этот процесс подробно объясняется:
Когда вы ищете что-то в поисковике Google, он выдает все релевантные страницы из своей базы данных — индекса. Поскольку часто запросу могут соответствовать миллионы страниц, алгоритм ранжирования Google делает все возможное, чтобы отсортировать их так, чтобы первыми шли страницы, которые лучше всего отвечают запросу.
Тут важно понимать, что индексирование и ранжирование — это совершенно разные вещи.
Индексирование — это регистрация на участие в гонке, а ранжирование — это распределение призовых мест.
Нельзя победить в гонке, не зарегистрировавшись сперва.
Как узнать, есть ли ваш сайт в индексе Google
Откройте сайт Google и введите в поиск site:ваш_сайт.com
Это число примерно показывает, сколько страниц вашего сайта содержится в индексе Google.
Если вы хотите узнать состояние индексирования конкретного URL-адреса, используйте тот же самый оператор site:ваш_сайт.com/адрес_страницы
.
Если результатов не будет, значит, страницы нет в индексе.
Стоит заметить, что если вы пользуетесь Google Search Console, то можете воспользоваться отчетом «Покрытие», чтобы получить более точные сведения о состоянии индексирования вашего сайта. Просто перейдите в раздел:
Google Search Console > Индексирование > Покрытие
Посмотрите на число действительных страниц (с предупреждениями и без).
Если эти числа в сумме отличаются от нуля, значит, по крайней мере часть страниц вашего сайта содержится в индексе Google. Если же оба числа равны нулю, то у вас серьезная проблема, поскольку ни одна страница сайта не проиндексирована.
Примечание.
Вы не пользуетесь Google Search Console? Зарегистрируйтесь. Это бесплатно. Каждый владелец сайта, которого заботит поисковый трафик, должен использовать Google Search Console. Да, настолько это важно.
В Search Console можно также проверить, проиндексирована ли конкретная страница. Для этого вставьте ее URL-адрес в Инструмент проверки URL.
Если страница проиндексирована, то сервис выдаст сообщение «URL есть в индексе Google».
Если нет — то «URL нет в индексе Google».
Как сделать так, чтобы Google индексировал ваш сайт
Обнаружили, что Google не индексирует ваш сайт или страницу? Попробуйте следующее:
- Откройте Google Search Console.
- Перейдите в Инструмент проверки URL.
- Вставьте в строку поиска URL-адрес, который вы хотите видеть в индексе Google.
- Подождите, пока Google проверит адрес.
- Нажмите кнопку «Запросить индексирование».
Это полезно делать, когда вы публикуете новую статью или страницу. Так вы напрямую сообщаете Google о том, что добавили что-то новое на свой сайт и что поисковику следует взглянуть на это.
Однако непосредственный запрос не поможет решить глубинные проблемы, которые препятствуют индексированию старых страниц. Если это ваш случай, то пройдитесь по приведенному ниже списку, чтобы диагностировать и решить проблему.
Вот ссылки на каждую тактику — на случай, если вы пробовали часть из них:
- Удалите блокирующие условия из файла robots.txt
- Удалите шальные теги noindex
- Добавьте адрес страницы в файл sitemap
- Удалите шальные теги canonical
- Проверьте, не является ли страница сиротой
- Почините внутренние nofollow-ссылки
- Добавьте «сильные» внутренние ссылки
- Убедитесь, что страница уникальна и обладает ценностью
- Удалите некачественные страницы (чтобы оптимизировать «краулинговый бюджет»)
- Получите качественные обратные ссылки
1) Удалите блокирующие условия из файла robots.
txtGoogle не индексирует весь ваш сайт? Причиной может быть блокирующее условие в файле robots.txt.
Чтобы проверить эту возможность, перейдите по адресу ваш_сайт.com/robots.txt.
Посмотрите, нет ли в тексте одного из этих фрагментов:
User-agent: Googlebot</p> <p>Disallow: /
User-agent: *</p> <p>Disallow: /
Оба этих фрагмента сообщают Гуглботу, что ему нельзя сканировать страницы вашего сайта. Чтобы исправить проблему, просто удалите их. И всё.
Блокирующее условие в файле robots.txt может быть виновным и в том случае, когда Google не индексирует отдельную страницу. Чтобы проверить этот вариант, вставьте адрес страницы в Инструмент проверки URL в Google Search Console. Откройте раздел «Покрытие» и поищите ошибку «Сканирование разрешено? Нет: заблокировано через robots.txt».
Эта ошибка указывает на то, что страница заблокирована в файле robots.txt.
В таком случае поищите в файле robots.
Важная страница заблокирована для индексирования в файле robots.txt.
Если нужно, удалите эти правила.
2) Удалите шальные теги noindex
Google не станет индексировать страницы, если попросить об этом. Так вы можете оградить некоторые страницы от публичного доступа. Есть два способа сделать это:
Способ 1: тег meta
Страницы с одним из этих тегов meta в секции <head>
не индексируются Google:
&lt;meta name=“robots” content=“noindex”&gt;
&lt;meta name=“googlebot” content=“noindex”&gt;
Это мета-тег robots, который сообщает поисковым системам, следует ли им индексировать данную страницу.
Примечание.
Главная часть — это значение “noindex”. Если вы видите его, значит, страница помечена как неиндексируемая.
Чтобы найти на своем сайте все страницы с мета-тегом noindex, запустите сканирование в сервисе Site Audit от Ahrefs. Перейдите в отчет Indexability («Индексируемость»). Поищите предупреждения «Noindex page» («Неиндексируемая страница»).
Нажмите на одно из них, чтобы увидеть все такие страницы. Удалите мета-тег noindex со всех страниц, где он не нужен.
Способ 2: X‑Robots-Tag
Поисковые роботы также учитывают заголовок HTTP-ответа X‑Robots-Tag. Вы можете реализовать его на скриптовом языке для серверной стороны типа PHP, через файл .htaccess file или через изменение конфигурации своего сервера.
Инструмент проверки URL в Search Console позволяет узнать, блокирует ли Google сканирование страницы из-за заголовка. Просто введите свой URL-адрес, а затем поищите ошибку «Индексирование разрешено? Нет: обнаружено значение ‘noindex’ в HTTP-заголовке X‑Robots-Tag».
Если вы хотите исправить эту проблему на своем сайте, запустите сканирование в сервисе Site Audit от Ahrefs, а затем примените фильтр «Robots information in HTTP header» («Информация для роботов в заголовке HTTP») в разделе Page Explorer:
Попросите своего разработчика исключить страницы, которые нужно индексировать, из числа тех, что возвращают такой заголовок
Рекомендуем прочесть: Использование HTTP-заголовка X‑Robots-Tag для поисковой оптимизации: Секреты и хитрости
3) Добавьте адрес страницы в файл sitemap
Файл sitemap сообщает Google, какие страницы вашего сайта важны, а какие нет. Также он может рекомендовать, как часто следует повторно сканировать определенные страницы.
Google способен находить страницы на вашем сайте независимо от того, представлены ли они в файле sitemap, но хорошей практикой является указание важных страниц. В конце концов, нет смысла усложнять работу Google.
Чтобы проверить, указана ли страница в файле sitemap, используйте Инструмент проверки URL в Search Console. Если вы увидите ошибку «URL нет в индексе Google» и «Sitemap: н/д», значит, страницы нет в файле sitemap или индексе.
Не пользуетесь Search Console? Перейдите по URL-адресу своего файла sitemap — обычно этоваш_сайт.com/sitemap.xml — и поищите адрес страницы.
Либо, если вы хотите найти все сканируемые и индексируемые страницы, которых нет в файле sitemap, запустите сканирование в сервисе Site Audit от Ahrefs. Перейдите в Page Explorer и примените следующие фильтры:
Вы получите список страниц, которые следует добавить в файл sitemap. Когда вы это сделаете, сообщите Google о том, что вы обновили свой файл sitemap, перейдя по этому URL:
http://www.google.com/ping?sitemap=<полный_URL_адрес_файла_sitemap>
Только подставьте туда URL-адрес своего файла sitemap. Вы увидите что-то подобное:
Это должно ускорить индексирование страницы поисковой системой.
4) Удалите шальные теги canonical
Тег каноничности (тег canonical) сообщает Google о канонической версии страницы. Выглядит он так:
<link rel=“canonical” href=“/страница.html”/>
Большая часть страниц либо не имеют тега canonical, либо содержат так называемый автореферентный тег canonical. Он сообщает поисковой системе о том, что страница сама является канонической, а возможно, и единственной версией. Другими словами, вы хотите, чтобы эта страница индексировалась.
Но если на страницу затесался шальной тег canonical, он может направить Google на каноническую версию страницы, которая на самом деле не существует. В таком случае страница не будет проиндексирована.
Чтобы проверить такую возможность, воспользуйтесь Инструментом проверки URL от Google. Если тег каноничности указывает на другую страницу, то вы увидите предупреждение «Альтернативная каноническая страница».
Если такого быть не должно, и вы хотите, чтобы страница индексировалась, удалите тег каноничности.
Если вы хотите быстро найти все шальные теги canonical на своем сайте, запустите сканирование в сервисе Site Audit от Ahrefs. Перейдите в раздел Page Explorer. Используйте такие настройки:
Они запустят поиск страниц в файле sitemap с неавтореферентными тегами каноничности. Если поиск с этим фильтром выдаст какие-либо результаты, вам следует разобраться с ними, поскольку вы наверняка хотели бы, чтобы эти страницы индексировались.
Высока вероятность того, что эти страницы либо содержат ошибочные теги каноничности, либо наоборот — не должны находиться в файле sitemap.
5) Проверьте, не является ли страница сиротой
Страницы-сироты — это такие страницы, на которые не ведет ни одной внутренней ссылки.
Поскольку Google находит новый контент, перемещаясь по Всемирной паутине от одной страницы к другой, он не может найти таким образом страницы-сироты. Точно так же их не смогут найти посетители сайта.
Чтобы найти страницы-сироты, просканируйте свой сайт при помощи сервиса Site Audit от Ahrefs. Затем откройте отчет Incoming links (Входящие ссылки) для ошибок «Orphan page (has no incoming internal links)» («Страница-сирота (не имеет входящих ссылок)»):
В нем показаны все индексируемые страницы, указанные в файле sitemap, на которые при этом не ведет ни одна внутренняя ссылка.
Вы не уверены, что все страницы, которые вы хотите видеть индексированными, указаны в файле sitemap? Попробуйте следующее:
- Загрузите полный список страниц вашего сайта (через систему CMS).
- Просканируйте сайт (при помощи Site Audit от Ahrefs или подобного сервиса).
- Сравните полученные списки URL-адресов.
Все адреса, не найденные в процессе сканирования, принадлежат страницам-сиротам.
Вы можете решить проблему страниц-сирот двумя способами:
- Если страница не важна, удалите ее и уберите из файла sitemap.
- Если страница важна, добавьте ее в схему внутренних ссылок сайта.
6) Почините внутренние nofollow-ссылки
Nofollow-ссылки — это ссылки с тегом rel=“nofollow”. Они препятствуют передаче показателя PageRank целевому URL-адресу. К тому же, Google не сканирует nofollow-ссылки.
Вот что об этом заявляют в Google:
По сути, использование атрибута nofollow заставляет Google не включать целевые ссылки в общий граф сети. Тем не менее, целевые страницы все равно могут попасть в наш индекс, если на других сайтах встретятся ссылки на них без атрибута nofollow либо если URL-адреса будут указаны в файле Sitemap.
Короче говоря, вам нужно убедиться, что внутренние ссылки на индексируемые страницы не должны иметь атрибута nofollow.
Для этого просканируйте свой сайт при помощи Site Audit от Ahrefs. В отчете Incoming links (Входящие ссылки) поищите индексируемые страницы с ошибками «Page has nofollow incoming internal links only» («На страницу ведут только внутренние nofollow-ссылки»):
Удалите атрибут nofollow из внутренних ссылок, если вы хотите, чтобы Google индексировал страницы, на которые они ведут. Если нет, то удалите страницы либо пометьте их тегом noindex.
Рекомендуем прочесть: Что такое nofollow-ссылки? Все, что вам нужно знать (без жаргона!)
7) Добавьте «сильные» внутренние ссылки
Google находит новый контент, сканируя ваш сайт. Если вы пренебрегаете созданием внутренних ссылок, то поисковик может и не найти некоторые страницы.
Одно из простых решений этой проблемы — добавить несколько внутренних ссылок, ведущих на нужную страницу. Разместить ссылки можно на любых других страницах, которые Google может сканировать и индексировать. Но если вы хотите, чтобы Google проиндексировал целевой контент как можно быстрее, то лучше всего разместить ссылку на одной из самых «сильных» страниц.
Почему? Потому что Google сканирует такие страницы чаще.
Для этого перейдите в Site Explorer от Ahrefs, введите адрес своего сайта, а затем откройте отчет Best by links (Лучшие по ссылкам).
В нем будут перечислены все страницы вашего сайта, отсортированные по показателю URL Rating (UR). Другими словами, он показывает первыми самые авторитетные страницы.
Пролистайте этот список, чтобы найти подходящие страницы, куда можно добавить внутренние ссылки на интересующую страницу.
Например, если мы хотим добавить внутреннюю ссылку на руководство по гостевому постингу, то руководство по линкбилдингу вполне подойдет для этого. Последняя страница очень кстати оказывается 11‑й по авторитетности в нашем блоге:
В следующий раз, когда Google будет сканировать эту страницу, он обнаружит новую ссылку и перейдет по ней.
8) Убедитесь, что страница уникальна и обладает ценностью
Google, как правило, не индексирует некачественные страницы, которые не представляют ценности для пользователей. Вот что Джон Мюллер из Google говорил об индексировании в 2018 году:
Мы не индексируем все существующие URL-адреса, и это нормально. Сосредоточьтесь на том, чтобы делать сайт замечательным и вдохновляющим, и тогда у вас не будет проблем с индексированием.
— John (@JohnMu) January 3, 2018
То есть, если вы хотите, чтобы Google проиндексировал ваш сайт или страницу, их содержание должно быть «замечательным и вдохновляющим».
Если вы не находите технических причин отсутствия индексирования, возможно, виновником является отсутствие ценности. Поэтому нелишне будет взглянуть на страницу свежим взглядом и спросить себя, действительно ли эта страница имеет ценность и принесет ли она пользу тому, кто перейдет на нее из результатов поиска.
Если ответом будет «нет», значит, вам следует улучшить свой контент.
Вы можете использовать Site Audit от Ahrefs и URL Profiler, чтобы найти другие потенциально некачественные страницы, которые не индексируются. Для этого перейдите в раздел Page Explorer в Site Audit и установите такие настройки:
Так вы получите «слабые» страницы — индексируемые, но не приносящие в данный момент естественного трафика. Высока вероятность того, что они не проиндексированы.
Экспортируйте отчет, а затем вставьте все URL-адреса в URL Profiler и запустите проверку Google Indexation (Индексирование в Google).
Источник: https://urlprofiler.com/blog/google-indexation-checker-tutorial/
Проверьте качество страниц, которые не индексируются. Улучшите качество, где это необходимо, и запросите индексирование в Google Search Console.
Также следует проверить возможность дублирования контента. Google старается не индексировать страницы-копии и очень похожие страницы. Загляните в отчет Content quality (Качество контента) в сервисе Site Audit, чтобы проверить этот вариант.
9) Удалите некачественные страницы (чтобы оптимизировать «краулинговый бюджет»)
Слишком большое число некачественных страниц на сайте приводит к пустой трате краулингового бюджета.
Вот что об этом говорят в Google:
[Страницы-с-низкой-ценностью] отвлекают на себя активность сканирования от страниц, которую действительно имеют ценность, что способно приводить к значительным задержкам в обнаружении хорошего контента на сайте.
Представьте, что учитель проверяет сочинения, одно из которых — ваше. Если ему нужно оценить десять сочинений, то он довольно быстро доберется до вашего. Если сочинений будет сто, то ему потребуется гораздо больше времени. Если их будут тысячи, то нагрузка будет слишком высокой, и учитель может вообще никогда не добраться до оценки вашего сочинения.
В Google заявляют, что «краулинговый бюджет […] — это не то, о чем большинству стоит беспокоиться», и что «если на сайте меньше нескольких тысяч адресов, то большую часть времени он будет сканироваться эффективно».
Тем не менее, удаление некачественных страниц с вашего сайта никогда не повредит. Это только пойдет на пользу краулинговому бюджету.
Вы можете использовать наш шаблон аудита контента, чтобы найти потенциально некачественные и нерелевантные страницы, которые можно удалить.
10) Получите качественные обратные ссылки
Обратные ссылки сообщают Google о том, что страница, на которую они ведут, важна. Раз кто-то дает на нее ссылку, значит, у нее должна быть некая ценность, верно? Поэтому Google индексирует страницы с обратными ссылками.
Для полной прозрачности Google индексирует не только страницы, имеющие обратные ссылки. Есть множество (миллиарды) проиндексированных страниц без обратных ссылок. Но поскольку Google считает страницы с качественными ссылками более важными, поисковик будет быстрее и чаще сканировать такие страницы, чем те, у которых нет обратных ссылок. То есть, индексирование страниц с качественными обратными ссылками происходит быстрее.
В нашем блоге есть много материалов по созданию качественных обратных ссылок.
Ниже приведены ссылки на некоторые из них.
Связанные статьи
Индексирование и ранжирование — это разные вещи
Наличие вашего сайта в индексе Google не означает, что он будет попадать в выдачу и приносить трафик.
Это разные вещи.
Индексирование означает только то, что Google известно о существовании вашего сайта. Это не означает, что ваш сайт будет показан в топе выдачи по подходящим запросам.
Тут-то и вступает в дело SEO — искусство оптимизации веб-страниц для попадания в топ выдачи по определенным запросам.
В общих чертах поисковая оптимизация (SEO) включает в себя:
- Определение тем, которые ищут ваши клиенты.
- Создание контента на эти темы.
- Оптимизацию созданных страниц под целевые ключевые фразы.
- Наращивание обратных ссылок.
- Постоянное поддержание контента в актуальном состоянии.
Вот видео, которое поможет разобраться в основах SEO:
…И несколько статей:
Связанные статьи
Напоследок
Есть только две возможные причины, почему Google не индексирует ваш сайт или веб-страницу:
- Технические проблемы, которые не дают поисковому роботу сделать это.
- Качество контента — Google считает ваш сайт или страницу некачественными и бесполезными для своих пользователей.
Вполне возможно, что имеют место обе эти проблемы. Но, по моему опыту, технические проблемы встречаются гораздо чаще. Технические проблемы также могут стать причиной автоматического создания индексируемого некачественного контента (например, проблемы с фасетной навигацией). Это нехорошо.
Но проход по приведенному выше списку в девяти случаях из десяти должен решить проблемы индексирования.
Только не забывайте, что индексирование и ранжирование — это разные вещи. Выполнение поисковой оптимизации по-прежнему жизненно необходимо, если вы хотите вывести свои страницы в топ выдачи по подходящим поисковым запросам и привлечь стабильный поток естественного трафика.
Перевела Кирик Наталья, владелец студии по написанию текстов для сайтов WordFactory.ua
Что такое индексация сайта в Google? — SEO
Категории
Olga Borzenko
14 сентября | 2021
Olga Borzenko
14 сентября | 2021
Вы задумывались, как быстро появляются результаты в Google после ввода поискового запроса? Сколько времени уходит у поисковика на отображение списка ссылок? Стоит только нажать Enter и моментально собираются миллионы релевантных результатов.
На самом деле, Google не ищет результаты по всем сайтам в Интернете. Он ищет их в своем индексе. Если владелец сайта не добавил страницы в индекс поисковой системы, пользователи не смогут их найти.
Индекс Google. Что это?
Индекс проще сравнить с огромной библиотекой. В ее каталоге содержатся миллиарды страниц. Когда пользователи хотят что-то найти, Google из своей библиотеки выбирает наиболее подходящие ссылки и формирует из них выдачу.
«Проиндексированная» веб-страница потенциально может появиться в результатах поиска. Без индексации в Google никто не сможет найти страницу, даже если она на 100% подходит под запрос пользователя.
Как Google индексирует страницы?
Процесс индексирования Google сложен. В нем много влияющих друг на друга этапов, но можно выделить три основных:
- Обнаружение — владелец сайта отправляет поисковому роботу файл XML sitemaps. В нем записаны все адреса страниц, размещенных на вашем сайте. Если Google видит новые адреса, он ставит их в очередь на сканирование.
- Сканирование — поисковик просматривает каждую обнаруженную страницу. Проводится сканирование контента для определения, на какие релевантные запросы он отвечает. Найденная информация передается в каталог индексации.
- Индексация — выполняется анализ содержимого и визуализация страницы. Google определяет, на какую позицию в рейтинге поместить вас. Далее страница отправляется в соответствующий каталог или индекс.
Цель поисковой системы Google — найти наилучшие ответы на запросы пользователей.
Как проверить, проиндексирована ли страница в Google?
Самый простой способ — ввести в поисковую строку Google URL-адрес страницы, которую нужно проверить. Если страница проиндексирована, она появится на первой позиции. Второй способ — использовать команду «site:» перед ссылкой (это узкий поиск только по вашему сайту).
Если страница не появилась, значит еще находится в «очереди на сканирование».
Полный список непроиндексированных страниц можно найти в Google Search Console.
Как ускорить индексацию?
Если на сайте часто публикуется контент, поисковик сам периодически сканирует его страницы. Это хорошо видно по новостным ресурсам. Изменения в поисковой выдаче появляются в первые несколько часов после публикации.
Скорее всего, на вашем сайте нет такого объема контента. Поэтому Google уделяет сайту меньше внимания, а автоматическая индексация занимает 1-2 недели. Хотите быстрее? Есть несколько способов.
Google Search Console
Если нужно проиндексировать одну страницу, введите ее URL в верхней строке Search Console. Система выполнит поиск адреса в своей базе. Если он новый, вы увидите сообщение «URL нет в Google».
Нажмите кнопку «Запросить индексирование» и если робот не найдет ошибок, запустится процесс индексации. Это займет от суток до нескольких недель. Конкретнее сказать сложно. Зависит от репутации сайта и плановой работы, которую предстоит выполнить Google.
Если обнаружится, что URL является неиндексируемым, запросить индексирование будет невозможно. В таком случае используйте файл Sitemap.xml.
Файл Sitemap.xml
Чтобы ускорить индексацию большого количества нового контента или новых страниц сайта, добавьте их в файл Sitemap.xml. Готовый файл также нужно отправить в Google из Search Console на индексацию.
Для этого необходимо набрать в браузере:
https://www.google.com/ping? sitemap = https://www.ваш сайт.xxx/sitemap_index.xml
(Вместо sitemap_index.xml может быть sitemap.xml. Это зависит от вашего SEO-специалиста или веб-мастера. Просто нужен путь к вашему файлу Sitemap)
Search Console показывает общее количество URL-адресов, включенных в Sitemap, и дату их последнего сканирования.
Перелинковка (внутренние ссылки)
Индексация контента пройдет быстрее, если создать на него ссылки с других страниц. Важно! Они должны быть уже проиндексированными и регулярно приводить органический трафик.
Как это правильно сделать? Найдите в Google Analytics страницы с регулярным органическим трафиком. Откройте нужную в админке и добавьте в текст ссылку на новую страницу.
Google Adwords
Еще один вариант, с помощью которого вы можете попытаться «обнаружить» URL-адрес в Google, это использовать инструмент Google Adwords.
В планировщике ключевых слов сделайте подборку ключей через вкладку «Указать сайт». Рекламный кабинет тесно связан с поисковым роботом, поэтому добавление в него новой ссылки поможет обратить на себя внимание Google.
Сайты статистики и пинга
В Интернете существует множество статистических служб. Они занимаются сканированием сайтов, чтобы собирать данные типа регистратора домена, хостинг и т.д. Эти службы можно использовать, чтобы распространять ваш URL-адрес и получать временные бэклинки:
- Indexkings.com.
- Linkcentaur.com (нужно создать учетную запись).
- Pingfarm.com.
- Bulklink.org.
Еще попробуйте расширение для браузера Chrome: Mass Fast Pinger.
Социальные сети
Переходы пользователей по новой ссылке помогут обратить внимание поискового робота. Для этого отлично подойдут социальные сети с платным и бесплатным трафиком. Можно размещать URL в собственных аккаунтах и в чужих блогах, но тут стоит осторожничать. Можно попасть под бан модераторов.
Для корпоративных сайтов хорошо подойдут:
- Facebook.
- Linkedin.
- Twitter.
Для творчества и увлечений:
- Pinterest.
- Instagram (ссылка в шапке профиля).
- Behance.
Если есть собственный SMM-щик, а контент гибкий, никто не мешает комбинировать оба списка. Главное — живые переходы.
YouTube
Опубликуйте видео на YouTube со ссылкой на страницу, которую Google нужно проиндексировать. Лучше всего это работает в популярных каналах с регулярной публикацией новых роликов.
Если ваш аккаунт не популярен, можно пойти через сторонние каналы. Есть друзья-блогеры? Отлично, возможно они бесплатно добавят ссылку. Нет друзей-блогеров? Можно поискать тематические каналы договориться о платном размещении. Правда это уже из области рекламы 😉
5 ошибок, которые мешают индексации страниц
Google открыто говорит — даже если поисковая система найдет и полностью просканирует URL-адрес, это не гарантия включения страницы в «каталог». Вот несколько причин, почему страницы не попадают в индекс:
- Качество — отсутствие уникального, ценного контента, который Google хочет показать пользователям.
- Дублированные страницы — если на сайте есть дубли, используйте атрибут canonical или 301 редирект. Атрибут canonical указывает, какие страницы являются основными, каноничными. Он сделает так, что поисковик не будет ругаться на повторы и выдаст пользователю страницу только с каноничным тегом.
- Краулинговый бюджет (Crawl Budget) — Googlebot, сканирует только определенное (неизвестное) количество URL-адресов на каждом сайте. Потратив «бюджет» на ненужные страницы, бот может уйти, так и не посетив страницы с важным контентом. Этот параметр стоит учитывать, если нужно проиндексировать сразу много страниц.
- Страницы с ответом сервера 404 — ошибка 404 означает, что на индексацию отправлена удаленная или несуществующая страница.
- Проблемы индексации — часто с самим сайтом есть технические проблемы, которые не позволяют провести сканирование. Одной из важных является проблема с robots.txt. Если Googlebot находит robots.txt, но не может получить к нему доступ, он игнорирует сайт вообще.
Какие страницы необходимо исключать из индекса?
В ваших интересах исключить некоторые страницы из индексации. К ним относятся: старые URL-адреса, неактуальные статьи, страницы с личными данными пользователей, все возможные дубли и т.д. Попадание таких страниц в список индексации ухудшит ее качество.
Закрыть страницы от индекса можно двумя способами:
- Файл robots. txt. — он расположен в корневом каталоге сайта. Через директивы «Allow» и «Disallow» он разрешает или запрещает поисковым системам индексировать страницы сайта.
- Тег «NoIndex» — это строка кода, которая добавляется в HTML-код страницы сайта. Например: <meta name=»robots» content=»noindex,follow» />. Для правильной работы он должен размещаться в разделе head.
Выводы
Индексация поисковым роботом — необходимое условие для получения органического трафика от Google. Нехитрыми манипуляциями этот процесс можно ускорить.
Хоть мы все представляем Google как поискового монополиста, он постоянно конкурирует с менее развитыми поисковиками. Ему нужен полезный контент, чтобы показать его пользователям. Если вы его сделаете и будете следовать вышеописанным инструкциям, органический трафик придет на страницы очень быстро.
- #SEO
- #индексация сайта
Подписаться
Блог
Vacancy
Подписаться
Блог
Vacancy
Получить спецпредложение
Некорректно введен Email
Пожалуйста, заполните поля отмеченныеИндексация сайта в Google — как Гугл индексирует сайты
Последнее обновление: 02 декабря 2020 года
3845
О чем статья:
-
Зачем поисковики индексируют сайты;
-
Почему это важно пользователям и компаниям;
-
Что влияет на индексацию;
-
Как проиндексировать сайт в Google;
-
Как проверить результат и избежать ошибок.
Индексация сайта: зачем она нужна и как выполняется
На конец 2020 года в интернете насчитывается около 2 миллиардов веб-сайтов. Из них активны примерно 400 миллионов. И каждый день создаются тысячи новых страниц. Чтобы пользователи могли легко и быстро находить в таком объеме данных именно то, что их интересует, поисковые системы четко структурируют информацию и размещают её в своих каталогах — в них хранятся сведения обо всех страницах всех сайтов в интернете.
Индексация сайтов – это, по сути, внесение всей имеющейся на страницах информации, включая изображения, тексты, ключевые фразы, ссылки, и видео, в каталог поисковика. Только после этого сайты могут попасть в поисковую выдачу.
Алгоритмы индексации
Индексацию выполняют поисковые роботы. Они в автоматизированном режиме проверяют обновление контента на сайте. Считается, что среди всех поисковых систем именно Google выполняет проверку новых ресурсов быстрее всего. Тем не менее, на скорость работы роботов также влияет посещаемость сайта и частота обновления информации. Например, на новостные порталы, где контент обновляется постоянно и через короткие промежутки времени, роботы заходят до нескольких раз в день. Если информация обновляется реже, то индексация может проводиться 1-2 раза в неделю. Если содержание страницы не обновлялось давно, робот будет заходить на нее, но не чаще раза в неделю.
За одно посещение робот индексирует 20-30 страниц, чтобы не перегружать сервер. Если на сайте больше страниц, робот зайдет на него несколько раз.
Каждый поисковик устанавливает глубину индексации – то есть, на сколько уровней робот может опуститься, переходя по ссылкам одного ресурса. Как правило, он изучает верхние уровни и при достижении определенной метки покидает сайт. Это означает, что при разветвленной структуре некоторые вложенные страницы могут остаться непроиндексированными.
Ранжирование сайта после индексации
После того, как роботы закончат анализ страницы, они вносят всю информацию в базу данных каталога, ранжируют сайт и определяют его авторитетность. Показатели PageRank зависят от количества и качества ссылок, которые ведут на ресурс – чем больше ссылочная масса, тем выше рейтинг. Авторитетность страниц определяется по 10-балльной шкале. Если сайт набрал 4-5 баллов, то это хороший показатель.
Требования к сайту для индексации
Есть три основных фактора, которые влияют на индексацию.
-
Посещаемость ресурса. Содержание страниц должно соответствовать запросам пользователей в поисковике. Для этого в текстах и метатегах необходимо размесить ключевые слова.
-
Качество контента. Контент должен быть уникальным и полезным, а тексты написаны без грамматических ошибок. Роботы отслеживают ошибки и снижают авторитетность сайтов. Желательно регулярно обновлять контент. О том, какой контент нравится Google, читайте в нашей статье.
-
Внутренняя оптимизация. Сайт должен иметь понятную и удобную для пользователей структуру. Необходимо, чтобы раздел контактов и обратной связи содержал релевантную информацию. Желательно размещать портфолио и отзывы. Все исходящие ссылки должны быть работающими.
Как добавить сайт на индексацию в Google?
Для того чтобы сайт появился в результатах поиска Google, не обязательно предпринимать какие-либо действия. Рано или поздно поисковые роботы найдут его и проиндексируют. Но, как мы говорили выше, боты перемещаются по сайту, переходя по ссылкам, и если ссылочной массы, ведущей на страницу, недостаточно, то пройдет довольно много времени, прежде чем роботы попадут на неё.
Чтобы помочь поисковым алгоритмам быстрее понять, как организован контент на вашем сайте, и точнее проиндексировать его, Google предлагает бесплатный инструмент Search Console. С его помощью можно подавать запросы на индексирование, узнать, как роботы видят сайт, выявить и устранить проблемы. В Google Search Console можно получить информацию, которая поможет улучшить взаимодействие ресурса с системами и пользователями.
Индексация сайта с помощью Search Console
Для индексации в Google, выполните следующие шаги:
-
Создайте Google-аккаунт, если у вас его еще нет, или авторизуйтесь в существующем.
-
Перейдите в раздел Инструменты веб-мастера по ссылке https://www.google.com/webmasters/tools/submit-url.
-
Введите адрес главной страницы сайта и пройдите проверку, что вы не робот.
-
Подтвердите свои права на сайт. В инструкции Google предлагает 8 вариантов подтверждения и напоминает, что лучше иметь несколько запасных на случай, если основной перестанет работать.
-
Создайте файл Sitemap.xml. Это карта сайта, в которой содержится информация о структуре и контенте ресурса – страницах, изображениях, видео и пр. В файле можно указать все дополнительные сведения: какие разделы важны, когда страница обновлялась последний раз, есть ли версии на других языках и другие. Также можно добавить специфические данные о видео и изображениях: продолжительность записи, возрастные ограничения, тип файла, условия лицензирования и т.д.
-
Проверьте, что в файле Sitemap.xml нет ошибок. В разделе Инструменты веб-мастера зайдите в панель управления сайтом. Нажмите кнопку «Сканирование» и выберите пункт «Файлы Sitemap». Перейдите в раздел «Добавление/проверка файла Sitemap» и укажите адрес файла. Выберите «Проверить Sitemap».
-
После проверки в этом же разделе нажмите на кнопку «Отправить файл Sitemap».
Теперь сайт индексируется в Google. Помните, что индексация материалов сайтов поисковиком не означает продвижение. Для того чтобы попасть в топ выдачи придется приложить гораздо больше усилий. Об эффективной поисковой оптимизации читайте в наших статьях с хештегом SEO.
Как проверить, что сайт проиндексирован
Базовый способ – посмотреть данные на обзорной странице Search Console. Там будут представлены все сводные данные на основе ключевых показателей, в том числе – статус индексирования. В Search Console также доступен Отчет об индексировании и Отчет о файлах Sitemap. Если вы видите рост количества ошибок, связанных с индексированием, своевременно исправляйте их, так как ошибки влияют на результаты поисковой оптимизации.
Второй вариант проверки – вручную с помощью поискового оператора «site:». Введите в поисковую строку команду: site:[url_сайта], чтобы получить данные о количестве проиндексированных страниц.
В автоматическом режиме можно выполнить проверку с помощь плагинов и букмарклетов – закладок браузера.
Также можно установить специальные сервисы для проверки индексации сайта.
Возможные проблемы при индексации
Возможны две ситуации, при которых Google не проиндексирует ваш сайт:
-
В случае проблем с сервером. Вы увидите сообщение о том, что хостинг не отвечает на запросы системы, и не сможете выполнить процедуру. В этом случае повторите попытку позже, когда сайт снова заработает. Если проблемы с хостингом возникают систематически, подумайте о смене провайдера. Отсутствие ошибок на сайтах и стабильная их работа учитывается алгоритмами поисковых систем при ранжировании в выдаче. Кроме того, вряд ли вы захотите потерять клиентов из-за неработающего сайта.
- При попадании под санкции Google. В этой ситуации появится сообщение о том, что адрес сайта запрещен к добавлению на индексацию. Санкции могут быть разными, и выданы по разным причинам. Если вы уверены, что не сделали ничего плохого за время владения сайтом, возможно, санкции были наложены в тот период, когда им управлял предыдущий собственник. Поэтому очень важно проверять сайты на бан поисковиков перед тем, как покупать их. Если вы узнали о санкциях по факту, можно попробовать узнать причину на форуме Google. Но для того, чтобы быстро пройти индексацию сайта, проще развивать проект на другом домене.
Быстрая индексация в Google
Чтобы не ждать, пока робот поисковой системы зайдет на сайт и проиндексирует новые страницы, можно ускорить процесс и прибегнуть к нескольким эффективным способам:
-
Через панель веб-мастера Google. В разделе «Сканировать» выберите пункт «Посмотреть как Googlebot». Вставьте адрес новой страницы в соответствующее поле без адреса самого сайта — то есть удалить из URL эту часть. Нажмите кнопку «Сканировать», а по завершении процесса – кнопку «Добавить в индекс». Появление сканированной страницы в индексе займет от нескольких минут до получаса. Единственный недостаток такого способа заключается в том, что его необходимо выполнять вручную. Если вам нужно проиндексировать в Google сразу несколько страниц, это потребует времени.
-
С использованием файла Sitemap.xml. Он определяет скорость индексации новых страниц, поэтому ссылки на них нужно добавлять сразу же. Так роботы будут находить их быстрее. Рекомендуем использовать динамический Sitemap.XML, а не обновлять его вручную после каждой корректировки сайта.
-
С помощью оптимизации файла robots.txt. Этот файл позволяет задать поисковым роботам Google директивы, в соответствии с которыми они могут проиндексировать содержимое сайта. На скорость процесса особенно влияет директива Disallow. Она определяет, какие файлы, веб-страницы и разделы не нужно индексировать и благодаря этому роботы быстрее доходят до новых страниц.
-
С помощью социальных сетей и RSS-канала. Можно ускорить индексацию сайта или нового контента, если опубликовать ссылки на него в социальных сетях. Добавьте на страницы кнопки соцсетей, чтобы посетители могли делиться вашими материалами в своих профилях и наращивать ссылочную массу. Создайте RSS-канал и добавляйте в него ссылки на новые страницы. С точки зрения пользователей, этот формат распространения информации устаревает, однако для поисковых систем он все еще является хорошим источником сведений о появлении нового материала на сайте.
Индексация сайта в Google – не самая сложная задача. Однако после индексации стоит заняться продвижением, а это уже требует комплексной и продолжительной работы.
Материал подготовила Светлана Сирвида-Льорентэ.
10 способов заставить Google индексировать сайт
Содержание
- org/ListItem»>
Что такое индексирование сайта
- Как проверить, есть ли сайт в индексе Google
- Способы, как ускорить индексацию сайта в Google
- Отправьте сайт на проверку вручную
- Проверьте правила в robots.txt
- Проверьте карту сайта sitemap.xml org/ListItem»> Проверьте использование тега noindex
- Сделайте грамотную внутреннюю перелинковку сайта
- Получите качественные обратные ссылки
- Проработайте nofollow-ссылки
- Проверьте дубли и корректность использования атрибута rel=«canonical»
- Пишите качественный и уникальный контент org/ListItem»> Проверьте наличие страниц-сирот
Базовый этап работы по SEO — это настройка индексации сайта, ведь без индексации ресурс не смогут увидеть пользователи. Грамотная индексация в дальнейшем позволит избежать проблемы с продвижением.
Что такое индексирование сайта
Индексация сайта в Google — сбор и внесение информации о контенте ресурса в базу поисковой системы. Ранее Google сначала проверял десктопную версию сайта, но с 2019 года индексация сайта в Гугл начинается с проверки мобильной версии.
к содержанию ↑
Как проверить, есть ли сайт в индексе Google
Если вам надо знать, как проверить индексацию страницы в Google, обратитесь к одному из этих способов:
1. Используйте операторы поиска Google.
2. Откройте инструмент проверки URL-адресов в Google Search Console.
к содержанию ↑
Способы, как ускорить индексацию сайта в Google
Сложно сказать, как долго Гугл индексирует новый сайт. Это зависит от скорости загрузки, количества страниц и краулингового бюджета. Но все же существует ряд способов, которые могут ускорить индексацию сайта в Google.
Отправьте сайт на проверку вручную
Чтобы отправить сайт на индексацию в Гугл, необходимо:
- зайти в Google Search Console и найти инструмент проверки URL;
- ввести URL-адрес и подождать, пока Google его проверит;
- нажать на «Запросить индексирование».
Подобный способ больше подходит для новых страниц. Если вам необходимо понять, почему Google не индексирует сайт, либо вас интересует, как индексировать сайт в Гугл, когда ему уже несколько лет, присмотритесь к следующим способам.
к содержанию ↑
Проверьте правила в robots.txt
Просканируйте файл robots.txt на наличие блоков и запретов. Проблема может возникнуть из-за наличия правила «disallow». Если найдете подобные правила, значит Googlebot не сканирует и, соответственно, не индексирует страницу.
Для проверки откройте Google Search Console, найдите вкладку «Покрытие» и просканируйте robots.txt. Чтобы исправить ситуацию, достаточно удалить правило Disallow: / и снова отправить страницу на индексацию в Гугл.
к содержанию ↑
Проверьте карту сайта sitemap.xml
Sitemap распределяет и отображает важность страниц сайта. Быстро проверить наличие страниц в Sitemap вам поможет инструмент проверки URL в Search Console. Когда на экране появятся такие ошибки, вероятно страницы в карте сайта нет.
После того, как вы добавите необходимые страницы в файл sitemap.xml, не забудьте сообщить Google об обновлении.
к содержанию ↑
Проверьте использование тега noindex
Наличие тега в описании страницы не разрешает Googlebot индексировать ее. Чтобы проверить, если он на сайте, перейдите в контейнер <head>. Если там тег noindex присутствует рядом с тегом googlebot, тогда страница не индексируется в данной поисковой системе. Удалите теги, и страница снова будет доступна для индексации.
к содержанию ↑
Сделайте грамотную внутреннюю перелинковку сайта
Она предусматривает проставление ссылок с одной страницы ресурса на другую. Внутренняя структура повышает юзабилити, помогает пользователю быстро ориентироваться. Грамотная внутренняя перелинковка обеспечит значительное увеличение скорости индексации новых материалов и их появление в списке поисковых систем.
к содержанию ↑
Получите качественные обратные ссылки
Наличие этих ссылок показывает Google, что страница, на которую они указывают, имеет вес. Такие ресурсы Google считает более важными, поэтому чаще их сканирует. Но в погоне за обратными ссылками важно размещаться только на качественных и авторитетных ресурсах.
Проработайте nofollow-ссылки
Иногда индексация сайтов в Google невозможна из-за тега rel=«nofollow». Для исправления просканируйте внутренние ссылки и удалите его в случае обнаружения.
к содержанию ↑
Проверьте дубли и корректность использования атрибута rel=«canonical»
Наличие дублированного контента может быть еще одной причиной медленной или нулевой индексации Google. Если страница дублируется или имеет содержание на 99% похожее на другую страницу, Google вряд ли проиндексирует ее.
Итак, убедитесь, что на сайте нет повторяющихся страниц. Если есть, то рекомендуется указать каноническую версию ресурса с помощью тега rel=«canonical» или же удалить такие страницы, поскольку Google будет считать их содержание неуникальным.
к содержанию ↑
Пишите качественный и уникальный контент
Google не обращает внимание на страницы с неуникальным контентом. Поэтому если нет технических проблем, проблема может быть в содержании. Попробуйте взглянуть на контент глазами обычного человека, сделать его более интересным и полезным.
Проверьте наличие страниц-сирот
Страницы-сироты — это страницы, не связанные ни с одной другой страницей ресурса. Если SEO-аудит сайта выявил страницы-сироты, либо полностью уберите их из sitemap, либо добавьте, чтобы Google смог их индексировать.
Индексирование сайта значит, что поисковая система знает о ресурсе, но не факт, что он попадет в ТОП поисковой выдачи. Чтобы сайт получил ключевое место в выдаче, вам нужна SEO-оптимизация.
Специалисты digital-агентства Ланет CLICK осуществят проверку индексации сайта в Гугл, займутся SEO-продвижением, обеспечат грамотный линкбилдинг и качественный копирайтинг. С Ланет CLICK сайт не только будет индексироваться, но и попадет в ТОП поисковой выдачи.
что это такое, как происходит, как ускорить и проверить индексацию
Нравится статья?
Понравится и работать с нами.
Начать
- Что такое индексация и как она происходит
- Как быстрее попасть в индекс
- Как проверить индексацию сайта
- Почему сайт не индексируется и как это исправить
- Как закрыть сайт от индексации и когда это нужно
Индексация сайта в поисковых системах – это то, без чего SEO продвижение невозможно. Если страниц вашего сайта нет в индексе, они не выводятся в поисковой выдаче, а значит, в конкуренции за верхние позиции вы пока не участвуете, и пользователи из поиска не могут перейти к вам.
Разбираемся, как Яндекс и Google индексируют сайты, можно ли ускорить и проконтролировать процесс и каким страницам индексация не нужна.
Что такое индексация и как она происходит
Поисковые системы по запросу выдают пользователям подходящие страницы за пару секунд. Естественно, в это время роботы не перебирают реальные сайты – такой поиск тянулся бы часами. Для ускорения поисковики обращаются к собственной, заранее собранной базе данных. Эта база – и есть индекс.
Поисковики индексируют сайт автоматически, с помощью поисковых роботов – их называют пауками или краулерами. Упрощенно это выглядит так:
- Пауки постоянно отслеживают новые сайты и страницы в интернете.
- Попав на сайт, робот сканирует его. Если в корневой папке лежит правильно заполненный файл robots. txt (а мы настоятельно советуем его прописать и поместить туда), краулер быстрее поймет, какие страницы нужно индексировать, а какие – нет.
- На каждой странице робот в автоматическом режиме оценивает важнейшие элементы, от которых зависит позиция при ранжировании (ключевые запросы, текст, структуру, метатеги и пр.).
Что еще почитать: Как составить семантическое ядро сайта: пошаговое руководство
- Проиндексированные страницы передаются в базу данных. В каждый визит робот обрабатывает не так много страниц, до 30 штук, чтобы не перегружать ваш сервер.
- После индексации сайта страницы начинают отображаться в выдаче, ведь теперь поисковая система знает о них.
- В дальнейшем робот продолжает посещать ваш сайт, чтобы просканировать и добавить в базу новые страницы. Также поисковики могут удалять страницы из индекса, обнаружив на них технические ошибки. Если вы ежедневно публикуете контент, робот может заходить к вам несколько раз в день, а если сайт долго остается без изменений, то и поисковики будут реже обращать на него внимание (до 3 раз в месяц).
Индексация сайта в Яндексе сразу после запуска может занять до 1 месяца, а в Гугл – до 1 недели.
Как быстрее попасть в индекс
Для успешного продвижения в Яндексе и Google важно, чтобы новые страницы как можно скорее попадали в индекс и начинали ранжироваться. Поэтому советуем использовать возможности для ускоренной индексации сайта.
Как привлечь внимание поисковиков и быстрее занять место в выдаче:
- Обязательно составить служебный файл robots.txt и карту сайта Sitemap в помощь поисковым ботам.
- Войти в панели управления Google Search Console и «Яндекс.Вебмастер» и оставить заявку на индексацию конкретных страниц.
- Обеспечить надежность и скорость работы сайта – робот при обнаружении проблем на сайте снижает частоту обхода.
- Позаботиться о качественных внешних ссылках, которые добавят вам «веса» и повысят шансы на быструю индексацию сайта по ключевым словам.
- Регулярно добавлять новые страницы и публиковать свежие материалы – тогда поисковики будут чаще обращать внимание на ваш ресурс. Обязательно добавлять новые материалы в «Оригинальные тексты» в Яндекс.Вебмастере.
- Оптимизировать сайт в плане удобства для пользователей – юзабилити. В первую очередь, важны понятный каталог и система навигации, сеть перекрестных внутренних ссылок (перелинковка) – всё, что ускоряет перемещение бота по вашему сайту и помогает ему проиндексировать больше страниц за один раз.
Что еще почитать: Идеальный каталог для продвижения сайта
Кстати, быстро индексировать страницы нужно не только новым сайтам. Если вы обновили цены или описания в каталоге, прописали привлекательные метатеги Description или загрузили в блог горячую новость, вам тоже важно, чтобы индексацию не пришлось ждать месяцами.
Как проверить индексацию сайта
В первые недели после запуска нового сайта важно проверить, попали ли нужные страницы в индекс поисковых систем и сколько вообще страниц проиндексировано. Но и в дальнейшем советуем держать руку на пульсе.
Вот основные способы проверить индексацию сайта в поисковых системах:
- Вручную через брендовые запросы
- Через оператор site в поисковой строке
- В Яндекс.Вебмастере или Search Console в Гугл
- Автоматически с помощью плагинов, скриптов или специальных сервисов
Вводим в строке поиска название компании и просматриваем первую пару страниц выдачи. Способ самый простой, без технических сложностей, но не быстрый и не очень удобный.
Чуть сложнее, но точнее: вбиваем в поиске Яндекса или Гугл оператор site, а после него – адрес сайта.
Например, наберем URL zamkitut.ru для проверки индексации сайта. В результатах поиска будут только проиндексированные страницы заданного сайта, и ничего не придется выбирать вручную.
Способ для тех, у кого есть доступ к панели вебмастера. В Гугл нужно открыть вкладку «Индекс Google» и выбрать «Статус индексирования», а в Яндекс.Вебмастере развернуть меню «Индексирование сайта», а затем «Страницы в поиске». Здесь можно посмотреть не только текущее количество страниц в индексе, но и динамику.
Сервисы и программы – быстрый и надежный способ проверить индексацию сайта онлайн. Не вручную вбивать запросы: небольшие программы для проверки обычно можно сохранить в браузере, как закладки, и запускать при необходимости.
Советуем попробовать плагин RDS bar для разных браузеров, а также программы наподобие Netpeak Spider или Netpeak Checker.
Так выглядит рабочее окно Netpeak Spider: программа выдает много дополнительной информации, помимо количества страниц в индексе.
3 и 4 способ – самые информативные и удобные, мы советуем мониторить индексацию по ходу продвижения сайта именно так. В специальной программе или на панели вебмастера вы увидите, когда последний раз Яндекс индексировал сайт, какие именно страницы попали в индекс, какие проблемы выявили поисковики и т.д.
Почему сайт не индексируется и как это исправить
Иногда с индексацией возникают проблемы: сайт целиком или отдельные страницы перестают выводиться в поисковой выдаче. Почему Яндекс не индексирует сайт и как это исправить:
- Прошло недостаточно времени. Если сайт или группа страниц появились недавно, поисковой робот мог просто не успеть их проиндексировать – используйте наши приемы ускорения из списка выше.
- Неправильно заполнен файл robots.txt. Лучше доверить работу с этим служебным файлом программистам, потому что случайная ошибка в нем может запретить индексировать сайт без вашего ведома.
- Критичные для поисковиков ошибки на сайте – их важно находить и вовремя исправлять.
- Нет карты сайта (SiteMap). Обязательно пропишите ее и добавьте в корневую папку – карта поможет ускорить индексацию сайта.
- На сайте есть дубли страниц или контент, полностью скопированный с других ресурсов – такие страницы принципиально не индексируются.
- Сервер работает с перебоями. Если сайт периодически недоступен или загружается слишком медленно, могут быть проблемы с индексацией, так что есть смысл переехать на более надежный хостинг.
Что еще почитать: Выбор хостинга для SEO продвижения. Рейтинг 2019
Как закрыть сайт от индексации и когда это нужно
Иногда бывает нужно запретить индексацию сайта или отдельных страниц.
Зачем это делается:
- Чтобы в выдачу не попадали служебные страницы сайта: личный кабинет пользователя, корзина, панель управления и прочее.
- Чтобы поисковой робот быстрее добрался до целевых страниц и проиндексировал их, а не тратил время на малозначительный контент, который не нужно продвигать.
- Чтобы в индекс не попали дубли страниц (поисковики это не любят).
Пример страницы, которую нужно закрыть от индексации – корзина в интернет-магазине дверной фурнитуры.
Основные способы «спрятать» ненужные страницы или разделы от поисковиков:
- В файле robots.txt закрыть сайт от индексации позволяет директива Disallow – она прописывается рядом с адресами страниц, которые не должны попасть в выдачу.
- В коде страницы можно использовать тег «noindex» – он закрывает от индексации не ссылки, а только часть текста, заключенную внутри тега.
- Атрибут rel=«nofollow» – применяется к конкретной ссылке и указывает поисковым роботам, что по ней не нужно переходить. Этот атрибут понимают все поисковики.
- Мета-тег robots – он дает поисковым системам указания насчет индексации. Если в содержимом этого мета-тега прописать «noindex, nofollow», страница не будет индексироваться.
Важно: «noindex» считывает и понимает только Яндекс. Для управления индексацией в Google применяйте другие способы из этого списка.
Мы в «Эврике» контролируем индексацию сайтов, которые разрабатываем, запускаем и продвигаем в поисковиках. Нашим клиентам не приходится вникать в технические детали, ведь для этого в команде проекта есть все необходимые специалисты.
Продвижение сайтов в «Эврике»
Технологии, кейсы, стоимость
Обсудить проект
Поделитесь с друзьями
Еще по теме
Как распределить ключевые запросы по страницам сайта
Основы SEO: определяем, по каким запросам будем продвигать конкретные страницы сайта
Мобильная адаптация сайта и SEO продвижение в 2019 году
Как подняться в мобильной выдаче Яндекса и Google. Чек-лист по адаптации сайта
Продвижение сайтов в ТОП 10 Яндекса
Специфика продвижения сайта в поисковой системе Яндекс. Особенности и отличия от Google
Новый поиск Яндекса – конец SEO продвижению?
Большое обновление Яндекс.Поиска «Андромеда» и последствия для SEO
ИКС: новый показатель качества сайта от Яндекса
Суть нововведения и комментарии специалиста «Эврики»
Почему важно знать о хаосе в топе Яндекса
С начала лета позиции сайтов в результатах поиска Яндекса стали «прыгать». Что случилось?
Подписаться
Отзывы клиентов
www.sunmed.ru
Медицинские товары
Мы благодарны компании «Эврика» за профессиональный подход
Сотрудничаем несколько лет, полностью удовлетворены достигнутыми результатами за этот период и оперативной, «человеческой» схемой взаимодействия с нами со стороны нашего менеджера Ирины.
Читать полностью
abn.ru
Крупнейший дистрибутор материалов и оборудования для СКС
Благодарим за разработку сайтов abn.ru и hyperline.ru.
Благодарим ООО «Эврика» за работу по проектам abn. ru и hyperline.ru. Наше сотрудничество началось в 2015 году. По проекту abn.ru был спроектирован и реализован новый дизайн, выполнена адаптация верстки под мобильные устройства, а благодаря продвижению сайта трафик из поисковых систем увеличился в 2 раза.
Читать полностью
mir-nagrad.ru
Магазин наград
Благодаря «Эврике» не закрыл магазин
Я доволен своим интернет-магазином и уверен, что он полностью удовлетворяет запросы моих дорогих покупателей! Понравилось отношение ко мне и моему проекту, очень дружелюбное, и некоторые нюансы (правки по сайту, консультации по непонятной мне теме) проходят быстро, гладко, без нервов и без ударов по карману.
Читать полностью
www.gormed.su
Многопрофильная клиника
Результатами мы довольны
Раньше я платил за клики, не представляя, что клики и звонки – разные вещи. Работа с системой Calltouch поразила меня тем, насколько можно увеличить количество звонков. Не кликов, а именно звонков, уменьшив при этом расходы с помощью достаточно простых манипуляций. Результат впечатляющий.
Читать полностью
www.veselodetkam.ru
Агентство детских праздников
Вышли в лидеры отрасли
Сайт находится в ТОП-10 Яндекса по основным профильным поисковым запросам. В том, что наша компания получила почетное звание «Лидер отрасли 2017» в области зрелищных мероприятий, есть и заслуга наших высокопрофессиональных партнеров.
Читать полностью
Оставьте заявку
Ваше имя
Электронная почта
Телефон *
Нажимая на кнопку Отправить, я даю согласие на обработку персональных данныхКак проверить индексацию сайта в Яндексе и Google
Сайт может быть совершенным с технической и дизайнерской точек зрения, но если о нем неизвестно поисковым системам, то его продвижение невозможно. Оно начинается с индексации – добавления поисковой системой в свою базу контента сайта. На практике используется несколько способов, как проверить индексацию сайта.
оглавление
- Как посмотреть индексацию сайта
- Этапы индексации сайта
- Сканирование
- Индексация
- Как проверить индексацию сайта
- С помощью сервиса Rush Analytics
- С помощью поисковых операторов
- С помощью сервисов и плагинов
- Букмарклеты
- Яндекс Вебмастера
- 1 Вариант
- 2 вариант
- С помощью Google Search Console
- Как ускорить индексацию сайта
- Яндекс
- Google Search Console
- Ловец ботов
- Соцсети
- IndexNow Яндекс
- Google Api индекс
- Влияние домена на индексацию
- Как закрыть сайт от индексации
Этапы индексации сайта
В справочной информации поисковых систем Google и Яндекс термин “индексация” используется в разных контекстах.
Сканирование
У каждого сайта есть свой краулинговый бюджет, который зависит от:
По той причине, что ресурсы поисковых систем ограничены, робот-планировщик составляет список очередности обхода страниц, отталкиваясь от критериев полезности контента, его востребованности и популярности среди пользователей.
- скорости загрузки сайта;
- соотношения полезных/мусорных страниц;
- наличия дублей контента;
- корректности реализации навигации на сайте;
- популярности страниц;
- и т.д.
Поисковой бот в бесконечном режиме скачивает страницы и помещает их в базу, заменяя старый контент на новый.
Индексация
Далее поисковые системы выполняют следующие процессы:
- Другой робот загружает страницы и разбивает их по следующим элементам: мета-теги, изображения, текст, видеоматериалы, микроразметка и другие данные.
- Далее страница проверяется:
- открыта она к индексу или закрыта;
- наличие на странице тега canonical;
- оценивается качество контента;
- и т.д. по списку.
- При успешном прохождении проверки, документ добавляется в индекс.
Как проверить индексацию сайта
Существует несколько способов с помощью инструментов ПС или сторонних сервисов.
С помощью сервиса Rush Analytics
- Выбираете частоту проверки:
- ежедневная;
- еженедельная;
- ежемесячная;
- в ручном режиме;
2. Выбираете в какой поисковой системе хотите проверить наличие страниц в индексе
- Загружаете URL
- списком;
- файлом;
- ссылкой на sitemap.xml
4. И через несколько минут получаете результат
С помощью поисковых операторов
Операторами в данном случае называют особые сочетания символов, которые используются для уточнения параметров запросов. Как узнать индексацию сайта в Яндексе или Гугле с их помощью? Существует несколько методов:
- Оператор «site». В поисковой строке нужно ввести «site:адрес сайта». Необходимо учитывать, что если страниц много, информация может быть некорректной.
Оператор «host», работает по тому же принципу, что и «site», но область поиска сужается до конкретного домена, а поддомены в результатах показываться не будут.
С помощью сервисов и плагинов
- pr-cy.ru. Бесплатно можно проверить только 5 URL, плюс проверка проводится только в Google.
- arsenkin.ru. Индексацию в Яндексе сервис проводит бесплатно, в Google – только по платной подписке.
- Плагин RDS Bar, предназначенный для браузеров Chrome, Firefox и Opera. Выдает информацию о любой странице, которая открыта в браузере. Как проверить индексацию страницы, число проиндексированных картинок, ссылки на страницу – ответы на эти вопросы можно получить с помощью плагина RDS Bar.
Букмарклеты
Термином «букмарклет» называют специальный скрипт, с помощью которого можно автоматизировать рутинные действия, связанные с продвижением, в том числе узнать, сколько страниц сайта в индексе Яндекса. Чтобы пользоваться ими, нужно предварительно добавить закладку в браузере.
Скрипты позволяют анализировать любой сайт, в том числе конкурента: при его открытии нужно нажать на закладку – и получить подробную информацию о том, насколько виден сайт в поисковых системах.
Примеры таких скриптов:
- Как посмотреть индексацию сайта в Яндексе:
javascript:void(window.open(‘https://yandex.ru/yandsearch?text=site:’ + location.host)) .
- Как проверить индексацию сайта в Google:
javascript:void(window.open(‘https://www.google.com/search?q=site:’ + location.host)).
С помощью Яндекс Вебмастера
Необходимо, в первую очередь, добавить сайт в панель Яндекс Вебмастера, подтвердить ваши права на сайт.
1 Вариант
Переходим в раздел “Индексирование” — “Проверить статус URL” .
В этом разделе мы можем увидеть информацию о странице, которая находится в базе Яндекса.
2 Вариант
“Индексирование” — “Страницы в поиске”
Это общая актуальная сводка о статусе страниц на сайте.
- Можно посмотреть на исключенные страницы в разрезе причины исключени.
- Проанализировать историю структуры сайта.
- И конечно, понять что в индексе.
Также есть вариант выгрузки страниц в формате xls.
С помощью Google Search Console
Аналогичный инструмент для вебмастеров от Google — Google Search Console. Проиндексированные страницы отражены в разделе «Покрытие». В его верхнем углу есть кнопка «Нажать отчет», при нажатии на которую выдаются списки страниц с ошибками и без них. Необходимо выбрать страницы без ошибок, нажать кнопку «Сведения», после чего откроется подробный отчет по этим группам.
Как ускорить индексацию сайта
В первую очередь, необходимо сообщить поисковикам о новом сайте, только после этого имеет смысл задаваться вопросом, как проверить, сколько страниц в Яндексе или Гугле.
Самое эффективное решение – добавить сайт в сервисы для вебмастеров, перечисленные выше. В них можно указать ссылку на Sitemap, после чего поисковые системы начнут самостоятельно регулярно заходить на сайт и добавлять в поиск новые страницы. Существует несколько способов, позволяющих сократить это время.
Яндекс Вебмастер
Сервис для вебмастеров от Яндекса не только дает ответ на вопрос, как узнать индексацию страницы, но и позволяет ускорить процесс попадания и поиск. Для этого существует два способа:
- Переобход страниц – такая функция есть в разделе «Индексирование». В окно вставляются ссылки на страницы, которые нужно проиндексировать, после чего надо нажать кнопку «Отправить».
- Файлы Sitemap также добавляется в разделе «Индексирование». Робот прочитает его и посетит страницы, на которых он еще не был.
- Обход по счетчикам — при помощи Яндекс Метрики. Для начала их нужно установить, подтвердив права на сайт, после чего найти в разделе «Индексирование» подраздел «Обход по счетчикам». Если разрешить обход нажатием соответствующей кнопки, то все страницы, на которые зайдут посетители, по сведениям Метрики, будут индексироваться роботом.
Google Search Console
Аналогично сервису Яндекса, Google Search Console позволяет не только узнать, как проверить индексацию сайта в Google, но и «помочь» боту быстрее заметить новые страницы. Ссылка вставляется в строку проверки, после чего нужно нажать кнопку «Запросить индексацию». Кроме того, в этом случае также целесообразно добавить в сервис файл Sitemap.
Ловец ботов
Инструмент для ускорения индексации страниц поисковыми системами – в SEO называется «Ловец Ботов».
При каждом посещении сайта ботом поисковой системы, на посещаемой странице в специальном блоке — ротаторе расположенном в футере, показываются ссылки на не проиндексированные страницы. Робот с большой вероятностью может перейти по этим ссылкам и проиндексировать целевые страницы.
Соцсети
Размещение ссылки на новые страницы в социальных сетях когда-то было рабочим и результативным инструментом, но сегодня его эффективность снизилась, поскольку переход на сайт осуществляется через редирект (переадресацию). Рассчитывать только на этот способ ускорения индексации не стоит, однако, даже несмотря на редирект, его можно использовать как дополнение к остальным.
Такой вариант подходит только тем, кто, помимо сайта, регулярно ведет соцсети. Если нет возможности это делать, можно использовать кросс-постинг. Он предполагает, что сразу после того, как материал публикуется на сайте, его лид (вступительный абзац) постится на страницу в социальной сети со ссылкой на материал.
IndexNow Яндекс
Позволяет автоматически сообщать поисковым системам об изменениях на сайте, включая появление новых страниц, обновление или удаление текущих. Как настроить https://yandex.ru/support/webmaster/indexing-options/index-now.html
Google Api индекс
Она позволяет отправлять в поисковик ссылки на новые и обновленные страницы, а также удалять мусорные. Есть лимит – до 200 ссылок в день, но в большинстве случаев этого достаточно. Предусмотрена возможность настройки аналитики, которая позволяет посмотреть, какие ссылки были отправлены, и проверить индексацию статьи в соответствии с датой обхода сайта ботом поисковой системы.
Влияние домена на индексацию
Изначально доменные зоны были напрямую связаны с географией: например, российские сайты регистрировались в зоне ru. Однако сегодня они могут быть зарегистрированы в международной зоне com, что свидетельствует о коммерческой деятельности в интернете.
При появлении кириллических доменов действительно были проблемы с их индексацией, однако сейчас они в прошлом. Некоторые сложности остаются – например, проблемы со ссылками, которые выглядят не слишком привлекательно из-за преобразования в punycode. Однако при поиске ответа на вопрос, как проверить индексацию ссылки в доменах с кириллицей, проблем не возникает, и для них актуальны все описанные выше методы.
Как закрыть сайт от индексации
Индексация нужна не всегда, в некоторых случаях может возникнуть необходимость спрятать от поисковиков отдельные страницы – например, дубли. Для этого есть несколько способов:
- Установить запрет в файле robots.txt.
- Поставить <meta name=»robots» content=»noindex, nofollow»/> — метатег на странице, которую необходимо скрыть от роботов. Вместо robots прописывается название бота – yandex или googlebot.
- Установить пароль в .htaccess – на весь сайт либо на его отдельные страницы. Однако если страницы уже есть базе поисковиков, спрятать их с помощью этого способа невозможно: потребуется сначала удалить.
- Убрать ссылки из панелей для вебмастеров.
Важно помнить, что поисковики редко посещают сайты, которые долго не обновляются. Перед тем как проверить индексацию в Гугл или Яндекс, важно наладить регулярное наполнение сайта полезным, интересным, оптимизированным и соответствующим требованиям поисковиков контентом.
Все, что вам нужно знать
Сканирование и индексирование веб-сайтов — это первый шаг в сложном процессе понимания того, о чем веб-страницы, чтобы представить их в качестве ответов на запросы пользователей.
Поисковые системы постоянно совершенствуют методы сканирования и индексации веб-сайтов.
Понимание того, как Google и Bing подходят к задаче сканирования и индексации веб-сайтов, полезно при разработке стратегий улучшения видимости в поиске.
Как сегодня работают поисковые системы: индексирование
Давайте рассмотрим основные принципы работы поисковых систем.
Эта статья посвящена индексации. Итак, давайте углубимся в…
Индексирование
Индексирование — это то, с чего начинается процесс ранжирования после сканирования веб-сайта.
Индексирование, по сути, означает добавление содержимого веб-страницы в Google для рассмотрения при ранжировании.
Когда вы создаете новую страницу на своем сайте, ее можно проиндексировать несколькими способами.
Самый простой способ проиндексировать страницу — ничего не делать.
Поисковые роботы Google переходят по ссылкам, и, таким образом, при условии, что ваш сайт уже находится в индексе и что новый контент связан с вашим сайтом, Google в конечном итоге обнаружит его и добавит в свой индекс. Подробнее об этом позже.
Как ускорить индексацию страницы
Но что, если вы хотите, чтобы робот Googlebot быстрее попадал на вашу страницу?
Это может быть важно, если у вас своевременный контент или если вы внесли важное изменение на страницу, о которой нужно знать Google.
Я использую более быстрые методы, когда оптимизирую важную страницу или корректирую заголовок и/или описание, чтобы повысить число кликов. Я хочу конкретно знать, когда они были обнаружены и отображены в поисковой выдаче, чтобы знать, с чего начинается измерение улучшения.
В таких случаях можно использовать несколько дополнительных методов.
1. XML-карты сайта
XML-карты сайта — это самый старый и в целом надежный способ привлечь внимание поисковых систем к контенту.
XML-карта сайта предоставляет поисковым системам список всех страниц вашего сайта, а также дополнительную информацию о нем, например дату последнего изменения.
Карта сайта может быть отправлена в Bing через Bing Webmaster Tools, а также в Google через Search Console.
Однозначно рекомендуется!
Но когда вам нужна немедленная индексация страницы, это не особо надежно.
2. Запросить индексирование с помощью Google Search Console
В Search Console вы можете «Запросить индексирование».
Вы начинаете с нажатия на верхнее поле поиска, которое по умолчанию гласит: «Проверить и URL-адрес в домене.com».
Введите URL-адрес, который вы хотите проиндексировать, затем нажмите Enter.
Если страница уже известна Google, вам будет представлена куча информации о ней. Мы не будем вдаваться в это здесь, но я рекомендую войти в систему и посмотреть, что там, если вы еще этого не сделали.
Важная кнопка для наших целей здесь появляется независимо от того, была ли страница проиндексирована или нет — это означает, что она подходит для обнаружения контента или просто для запроса Google, чтобы понять недавнее изменение.
Вы найдете кнопку, как показано ниже.
Скриншот из Google Search Console, октябрь 2019 г.
В течение от нескольких секунд до нескольких минут вы можете выполнить поиск нового контента или URL-адреса в Google и найти измененный или новый контент.
3. Примите участие в Bing IndexNow
Bing использует открытый протокол, основанный на методе принудительного оповещения поисковых систем о новом или обновленном содержимом.
Этот новый протокол индексации поисковой системы называется IndexNow.
Он называется push-протоколом, потому что его идея состоит в том, чтобы предупреждать поисковые системы с помощью IndexNow о новом или обновленном контенте, который заставит их прийти и проиндексировать его.
Примером протокола извлечения является старый способ XML Sitemap, который зависит от сканера поисковой системы, который решает посетить и проиндексировать его (или получить его с помощью Search Console).
Преимущество IndexNow заключается в том, что он тратит меньше ресурсов веб-хостинга и центра обработки данных, что не только безвредно для окружающей среды, но и экономит ресурсы полосы пропускания.
Однако самым большим преимуществом является более быстрая индексация содержимого.
IndexNow в настоящее время используется только Bing и Яндекс.
Внедрить IndexNow очень просто:
- Существует плагин IndexNow для WordPress.
- Модуль Drupal IndexNow.
- IndexNow на Duda включен по умолчанию.
- IndexNow поддерживается Cloudflare.
- IndexNow поддерживается Akamai.
4. Инструменты Bing для веб-мастеров
Помимо участия в IndexNow рассмотрите возможность использования учетной записи Bing для веб-мастеров.
Если у вас нет учетной записи Bing Webmaster Tools, я не могу ее рекомендовать.
Предоставленная здесь информация является существенной и поможет вам лучше оценить проблемные области и улучшить свой рейтинг в Bing, Google и где-либо еще, а также, возможно, обеспечит лучший пользовательский опыт.
Но для того, чтобы ваш контент был проиндексирован, вам просто нужно щелкнуть: Настроить мой сайт > Отправить URL-адреса.
Оттуда вы вводите URL-адреса, которые хотите индексировать, и нажимаете «Отправить».
Скриншот из Bing Webmaster Tools, октябрь 2019 г.
Итак, это почти все, что вам нужно знать об индексировании и о том, как это делают поисковые системы (с прицелом на то, куда идут дела).
Дополнительные сведения см. на странице справки Инструментов для веб-мастеров Bing.
Существует также Bing Webmaster Tools Indexing API, который также может сократить время появления контента в результатах поиска Bing до нескольких часов. Подробнее об API индексирования Bing здесь.
Бюджет сканирования
Мы не можем говорить об индексации, не говоря о бюджете сканирования.
По сути, краулинговый бюджет — это термин, используемый для описания количества ресурсов, которые Google будет расходовать на сканирование веб-сайта.
Назначенный бюджет основан на сочетании факторов, двумя основными из которых являются:
- Насколько быстро работает ваш сервер (т.
- Насколько важен ваш сайт.
Если у вас крупный новостной сайт с постоянно обновляемым контентом, пользователи поисковых систем захотят знать, что ваш сайт будет часто сканироваться (осмелюсь сказать… постоянно).
Если вы управляете небольшой парикмахерской, имеете пару десятков ссылок и по праву не считаетесь важным в этом контексте (вы можете быть важным парикмахером в этом районе, но вы не важны, когда речь идет о краулинговом бюджете), тогда бюджет будет меньше.
Подробнее о краулинговых бюджетах и о том, как они определяются, можно прочитать в объяснении Google здесь.
У Google есть два вида сканирования
Индексирование Google начинается с сканирования, которое имеет два вида.
Первым видом сканирования является обнаружение, когда Google обнаруживает новые веб-страницы для добавления в индекс.
Второй вид сканирования — это обновление, когда Google находит изменения на уже проиндексированных веб-страницах.
Узнайте, как работают поисковые системы
Оптимизация веб-сайтов для поисковых систем начинается с хорошего контента и заканчивается его отправкой на индексацию.
Независимо от того, делаете ли вы это с помощью XML-карты сайта, инструмента отправки URL-адреса Google Search Console, инструментов Bing для веб-мастеров или IndexNow, индексация этого контента — это момент, когда ваша веб-страница начинает свой путь к вершине результатов поиска (если все работает !).
Вот почему важно понимать, как работает поисковая индексация.
Как работают поисковые системы рассматривает принципы работы поисковых систем и ключевые факторы, влияющие на страницы результатов поиска.
Загрузите его здесь.
Категория SEO
Руководство по поисковым системам: сканирование, индексация и ранжирование
Источник изображения: Getty Images
Поисковые системы сканируют Интернет, чтобы хранить и индексировать страницы в базе данных, а также предоставляют поисковые интерфейсы, чтобы мы могли получить доступ к обширной базе знаний человечества, называемой Интернетом.
Google стал глаголом и синонимом поиска в Интернете. Тем не менее поисковые системы в Интернете существовали до Google, и у неоспоримого лидера поискового маркетинга есть конкуренты по всему миру.
Bing от Microsoft вступил в бой, и пока российский Яндекс и чешский Seznam испытывают на себе давление со стороны Google, у Baidu такие же сильные позиции в Китае, как у Google в Западном полушарии.
Обзор: Что такое поисковая система?
Поисковые системы — это ворота, через которые вы проходите во всемирную паутину. Это человеко-машинный интерфейс, если считать Интернет машиной. Поисковая система — это интерфейс, который позволяет вам ориентироваться в Интернете, находить ответы на свои вопросы и, во все большей степени, находить товары или услуги для покупки.
В будущем поисковая система может стать вашим персональным помощником с искусственным интеллектом и голосовым управлением, который поможет вам организовать не только информацию, но и встречи, поездки, покупки и ваше здоровье.
Поисковая система строится вокруг запроса, также называемого ключевым словом или поисковым термином, и страницы результатов поисковой системы или поисковой выдачи для тех, кто в курсе. Высокая концентрация кликов в верхней части результатов поиска. На это есть несколько причин.
В интерфейсе может отображаться только ограниченное количество результатов, и когда результат предлагается в качестве первого, многие люди нажимают на него, вместо того чтобы читать другие. Кроме того, люди склонны доверять рейтингам. Если поисковая система помещает страницу на первую позицию, они предполагают, что она, вероятно, лучшая.
Это создало экономическую модель платной поисковой рекламы в верхней части поисковой выдачи и целую индустрию поисковых маркетологов, работающих над ранжированием веб-страниц как можно выше в этих результатах поиска. Эту работу выполняют наши дорогие друзья, SEO-специалисты, которые, если вы интересуетесь поисковыми системами, вероятно, знаете, что это аббревиатура от Search Engine Optimization.
Как работают поисковые системы?
Поисковая система — это очень сложное программное обеспечение, управляющее огромными объемами данных и обрабатывающее их с помощью продвинутых алгоритмов, включающих в себя все больше и больше искусственного интеллекта (ИИ).
Основными функциями поисковой системы в Интернете являются следующие:
- Сканирование сети
- Сохранение веб-страниц в базе данных
- Индексирование контента
- Предоставление интерфейса поиска
Сканирование12 сети 9000 Основная функция поисковой системы — «сканирование» Интернета.
Этот термин происходит от того факта, что поисковая система перемещается от страницы к странице в Интернете для сбора данных. Он просматривал весь контент и определял все ссылки, а затем начинал посещать каждую из этих ссылок — движение изображалось как паук, ползающий по всемирной паутине.На заре интернет-поиска от вас требовалось представить свой веб-сайт поисковым системам, чтобы они могли найти ваши страницы. Сегодня веб-сканирование Google настолько эффективно, что оно находит ваш сайт вскоре после того, как на него указывает ссылка с другой страницы.
Хранение веб-страниц
Поисковая система собирает информацию с найденных страниц и сохраняет их в агрегированном виде в базе данных. Ранние поисковые системы сохраняли только части страницы или просто метаинформацию (информацию об информации), скрытую в заголовке страницы. Сегодня нормой является сбор полного объема контента. Поисковые системы действительно хранят большие данные, пытаясь охватить весь Интернет.
Индексирование содержимого
Поисковая система выполняет процесс индексации веб-сайта для создания легкодоступного индекса содержимого. Он использует технику, известную как инвертированный индекс, в которой он классифицирует веб-страницы по доступным для поиска записям, таким как ключевые слова, темы или объекты. Это позволит ему находить и отображать релевантные данные намного быстрее, чем если бы ему приходилось выполнять поиск по всему контенту при каждом запросе.
Интерфейс поиска
Интерфейс поиска позволяет поисковым системам вводить и интерпретировать запросы по ключевым словам и отображать страницу результатов поиска с результатами инвертированного индекса. Интерфейс поиска состоит из поля запроса, которое представляет собой форму, в которой вы вводите поиск по ключевому слову и нажимаете кнопку, чтобы перейти на страницу результатов, показывающую ваш контент или ссылки на контент и обеспечивающую наиболее релевантные результаты, которые может найти поисковая система. .
Google изначально был только окном поиска с двумя кнопками. Нажатие кнопки «Поиск в Google» откроет страницу результатов поиска, а нажатие кнопки «Мне повезет» приведет вас к первому результату в списке. Источник изображения: Автор
Что такое поисковая оптимизация?
Верхние позиции в результатах поиска стали главной целью из-за того, что пользователи поисковых систем ленивы, нажимают на первый результат и доверяют алгоритму, чтобы обеспечить лучший результат в верхней части страницы. Рейтинги поисковых систем стали прайм-таймом в Интернете — местом, где пользователи выполняли поиск по ключевому слову, имеющему отношение к вашему бизнесу.
Индустрия SEO возникла задолго до того, как поисковые системы нашли свою экономическую модель с платным поиском. Специалисты по поисковой оптимизации будут исследовать, тестировать и узнавать, как улучшить веб-страницы, чтобы занимать первые позиции по наиболее релевантным ключевым словам.
SEO основывается на трех столпах: архитектуре, контенте и авторитете. Архитектура охватывает технические аспекты вашего веб-сайта, то есть время отклика, структуру страниц и ссылок, компоненты заголовков и метатеги.
Параметр «Контент» охватывает ключевые слова и контент веб-сайта. SEO-специалисты проведут исследование, чтобы найти лучшие ключевые слова для ранжирования, а затем создадут или закажут контент, который хорошо структурирован для этих ключевых слов. Измерение авторитета касается того, как ваш сайт воспринимается извне, силы бренда и ссылок, указывающих на сайт.
Существуют инструменты для каждого из трех столпов SEO, а также инструменты для мониторинга и измерения рыночных сил и эффективности. Источник изображения: Author
Анализ поисковых систем охватывает различные подходы, показанные на иллюстрации выше: сканирование сайта, исследование ключевых слов, оптимизация контента, анализ обратных ссылок, мониторинг рейтинга, а также различные подходы к анализу тенденций рынка и конкурентному анализу. Чтобы узнать больше об инструментах SEO, ознакомьтесь с обзорами The Ascent некоторых ведущих программных решений для SEO на рынке.
7 альтернатив Google для пользователей, чтобы найти ваш контент
Хотя Google считается ведущей поисковой системой в мире, он не единственный игрок на рынке и имеет множество конкурентов по всему миру. Давайте посмотрим, кто они ниже:
- Bing: Поисковая система Microsoft во многих аспектах является последователем, но она опирается на отличные технологии и амбиции. Это также заполнение с белой маркировкой для различных поисковых свойств по всему миру.
- DuckDuckGo: Небольшая поисковая система в США, которая не отслеживает пользователей и не фильтрует результаты поиска.
- Baidu: Китайская поисковая система, созданная Робином Ли, человеком, создавшим алгоритм Rankdex, вдохновивший Google. Baidu — ведущая поисковая система в Китае.
- Яндекс: Яндекс, что означает «Еще один индекс», был создан в России и в основном охватывает Россию и страны бывшего Советского Союза. Единственным другим дополнением является Турция, где Яндексу удалось конкурировать с Google.
- Naver: Южнокорейская поисковая система, доминирующая на местном рынке.
- Yahoo!: Yahoo! раньше был самой важной точкой входа в Интернет. Он использовал Google в качестве резерва, но был превзойден своим бывшим поставщиком услуг. Яху! Япония отличается от Yahoo! и главная поисковая система на этом рынке.
- Qwant: Французская поисковая система, стремящаяся привлечь пользователей удобным пользовательским интерфейсом и защитой конфиденциальности, аналогичной DuckDuckGo. Тем не менее, Qwant остается на низком уровне проникновения.
Шагните через ворота поисковой системы к знаниям
Поисковые системы являются одними из самых совершенных технических решений, которые видел мир, и являются краеугольным камнем бизнеса для Google, Yandex, Baidu и Microsoft. Они позволяют пользователям в любой точке мира получить доступ к большему количеству информации, чем кто-либо мог себе представить.
Ожидается, что со временем характер поиска будет развиваться в сторону более естественных интерфейсов, таких как голос и изображения, но сегодня он по-прежнему в основном основан на ключевых словах и тексте.
Маркетинг в поисковых системах с его двойным измерением SEO и платного поиска является одним из самых доминирующих и мощных каналов цифрового маркетинга. Поиск предоставляет поистине волшебное решение для доступа к огромным объемам данных, доступных в Интернете, и способствовал созданию экономической модели для Интернета. Просто погуглите, чтобы узнать больше.
Основы работы индексации в поисковых системах
Поисковая оптимизация (SEO) — важный способ повысить видимость вашего веб-сайта и привлечь больше органического трафика. Однако это сложная стратегия, основанная на понимании алгоритмов и использовании широкого спектра факторов ранжирования. Если вы хотите стать экспертом в области SEO, вам необходимо понимать индексацию поисковыми системами.
В этом посте мы объясним, как поисковые системы индексируют веб-сайты и как вы можете повысить свой рейтинг. Мы также ответим на некоторые часто задаваемые вопросы об этой концепции SEO. Давайте начнем!
Что такое индексация поисковыми системами?
Индексация поисковой системой — это процесс, при котором поисковая система (например, Google) организует и сохраняет онлайн-контент в центральной базе данных (ее индекс). Затем поисковая система может анализировать и понимать контент и предоставлять его читателям в ранжированных списках на своих страницах результатов поисковой системы (SERP).
Перед индексацией веб-сайта поисковая система использует «сканеры» для изучения ссылок и контента. Затем поисковая система берет просканированный контент и упорядочивает его в своей базе данных:
.Источник изображения: Seobility – Лицензия: CC BY-SA 4.0
В следующем разделе мы подробно рассмотрим, как работает этот процесс. На данный момент индексирование можно рассматривать как онлайн-систему хранения записей и страниц веб-сайтов, видео, изображений и другого контента. Когда дело доходит до Google, эта система представляет собой огромную базу данных, известную как индекс Google.
Как поисковая система индексирует сайт?
Поисковые системы, такие как Google, используют «сканеры» для изучения онлайн-контента и его классификации. Эти сканеры представляют собой программные боты, которые переходят по ссылкам, сканируют веб-страницы и собирают как можно больше данных о веб-сайте. Затем они доставляют информацию на серверы поисковой системы для индексации:
Источник изображения: Seobility – Лицензия: CC BY-SA 4.0
Каждый раз, когда контент публикуется или обновляется, поисковые системы сканируют и индексируют его, чтобы добавить информацию о нем в свои базы данных. Этот процесс может происходить автоматически, но вы можете ускорить его, отправив карты сайта в поисковые системы. Эти документы описывают инфраструктуру вашего веб-сайта, включая ссылки, чтобы помочь поисковым системам более эффективно сканировать и понимать ваш контент.
Сканеры поисковых систем работают на «краулинговом бюджете». Этот бюджет ограничивает количество страниц, которые боты будут сканировать и индексировать на вашем веб-сайте в течение установленного периода. (Однако они возвращаются.)
Сканеры собирают информацию о важных данных, таких как ключевые слова, даты публикации, изображения и видеофайлы. Поисковые системы также анализируют взаимосвязь между различными страницами и веб-сайтами, следуя и индексируя внутренние ссылки и внешние URL-адреса.
Обратите внимание, что сканеры поисковых систем не будут отслеживать все URL-адреса на веб-сайте. Они будут автоматически сканировать dofollow-ссылки, игнорируя их nofollow-эквиваленты. Поэтому вам нужно сосредоточиться на ссылках dofollow в своих усилиях по созданию ссылок. Это URL-адреса с внешних сайтов, которые указывают на ваш контент.
Если внешние ссылки исходят из высококачественных источников, они будут передавать свой «ссылочный вес», когда сканеры перейдут по ним с другого сайта на ваш. Таким образом, эти URL-адреса могут повысить ваш рейтинг в поисковой выдаче:
Источник изображения: Seobility – Лицензия: CC BY-SA 4.0
Кроме того, имейте в виду, что некоторый контент не сканируется поисковыми системами. Если ваши страницы скрыты за формами входа, паролями или в ваши изображения встроен текст, поисковые системы не смогут получить доступ и проиндексировать этот контент. (Однако вы можете использовать замещающий текст, чтобы эти изображения отображались в результатах поиска сами по себе. )
4 инструмента для индексации в поисковых системах
Вы можете использовать несколько инструментов, чтобы управлять тем, как Google и другие поисковые системы сканируют и индексируют ваш контент. Давайте рассмотрим несколько наиболее полезных вариантов!
1. Карты сайта
Имейте в виду, что существует два вида карт сайта: XML и HTML. Эти два понятия легко спутать, так как оба они являются типами карт сайта, которые заканчиваются на -ML , но они служат разным целям.
HTML-карты сайта — это удобные для пользователя файлы, в которых перечислены все материалы вашего веб-сайта. Например, вы обычно найдете одну из этих карт сайта в нижнем колонтитуле сайта. Прокрутите Apple.com до конца вниз, и вы найдете это, карту сайта в формате HTML:
Эта карта сайта позволяет посетителям легко перемещаться по вашему сайту. Он действует как общий каталог и может положительно повлиять на SEO и обеспечить надежный пользовательский опыт (UX).
Карта сайта XML, напротив, содержит список всех основных страниц вашего веб-сайта. Вы отправляете этот документ поисковым системам, чтобы они могли более эффективно сканировать и индексировать ваш контент:
Имейте в виду, что мы будем ссылаться на XML-документы, когда будем говорить о картах сайта в этой статье. Мы также рекомендуем ознакомиться с нашим руководством по созданию XML-карты сайта, чтобы у вас был готовый документ для различных поисковых систем.
2. Консоль поиска Google
Если вы хотите сосредоточить свои усилия по поисковой оптимизации на Google, консоль поиска Google является важным инструментом для освоения:
В консоли вы можете получить доступ к отчету об индексировании, в котором сообщается, какие страницы были проиндексированы Google, и выделяются любые проблемы в процессе. Здесь вы можете проанализировать проблемные URL-адреса и устранить неполадки, чтобы сделать их «индексируемыми».
Кроме того, вы можете отправить свою XML-карту сайта в Google Search Console. Этот документ действует как «дорожная карта» и помогает Google более эффективно индексировать ваш контент. Кроме того, вы можете попросить Google повторно просканировать определенные URL-адреса и части вашего сайта, чтобы обновленные темы всегда были доступны для вашей аудитории, не дожидаясь, пока поисковые роботы Google вернутся на ваш сайт.
3. Альтернативные консоли поисковых систем
Хотя Google является самой популярной поисковой системой, это не единственный вариант. Ограничение себя Google может закрыть ваш сайт для трафика из альтернативных источников, таких как Bing:
Мы рекомендуем ознакомиться с нашими руководствами по отправке файлов Sitemap в формате XML в Инструменты для веб-мастеров Bing и Инструменты для веб-мастеров Яндекса. К сожалению, другие поисковые системы, в том числе Yahoo и DuckDuckGo, не позволяют отправлять карты сайта.
Имейте в виду, что каждая из этих консолей предлагает уникальные инструменты для мониторинга индексации и рейтинга вашего сайта в поисковой выдаче. Поэтому мы рекомендуем попробовать их, если вы хотите расширить свою SEO-стратегию.
4. Роботы.txt
Мы уже рассмотрели, как вы можете использовать карту сайта, чтобы указать поисковым системам индексировать определенные страницы на вашем веб-сайте. Кроме того, вы можете исключить определенный контент, используя файл robots.txt .
Файл robots.txt содержит информацию об индексации вашего сайта. Он хранится в корневом каталоге и состоит из двух строк: user-agent строка, указывающая поисковый робот, и директива disallow , которая блокирует определенные файлы.
Например, файл robots.txt может выглядеть примерно так:
Агент пользователя: * Запретить: /example_page/ Запретить: /example_page_2/
В этом примере * охватывает все сканеры поисковых систем. Затем строки disallow указывают определенные файлы или URL-адреса.
Вам просто нужно создать простой текстовый файл и назвать его robots. txt . Затем добавьте данные , запрещающие , и загрузите файл в корневой каталог с помощью клиента протокола передачи файлов (FTP).
Часто задаваемые вопросы
До сих пор мы рассмотрели основы индексации поисковыми системами. Если у вас все еще есть вопросы об этой концепции SEO, мы ответим на них здесь! (И если он у вас все еще есть, дайте нам знать в комментариях, чтобы мы могли ответить на него там!)
Как улучшить индексацию поисковыми системами?
Вы можете улучшить индексацию поисковыми системами, создав карты сайта, проверив их на наличие ошибок сканирования и отправив их в несколько поисковых систем. Кроме того, вам следует подумать об оптимизации вашего контента для мобильных устройств и сокращении времени загрузки, чтобы ускорить сканирование и индексирование.
Частое обновление контента также может побудить поисковые системы сканировать и индексировать ваши «новые» страницы. Наконец, мы рекомендуем запретить поисковым системам сканировать повторяющийся контент, используя файл robots. txt или удалив его.
Должен ли я запрашивать поисковые системы для сканирования моего сайта?
Поисковые системы будут сканировать новый общедоступный контент в Интернете, но этот процесс может занять недели или месяцы. Поэтому вы можете предпочесть ускорить процесс, отправив карту сайта в поисковые системы по вашему выбору.
Должен ли я предупреждать поисковые системы, если я публикую новый контент?
Мы рекомендуем обновлять карту сайта при публикации нового контента. Такой подход гарантирует, что ваши сообщения будут сканироваться и индексироваться быстрее. Мы рекомендуем использовать плагин, такой как Yoast SEO, чтобы легко создавать карты сайта.
Мой контент когда-либо удалялся из Google или других поисковых систем?
Google может удалить сообщение или страницу из своего индекса, если содержание нарушает условия обслуживания. Это означает, что контент во многих случаях нарушает конфиденциальность, клевету, авторские права или другие законы. Google также удаляет из своего индекса личные данные, такие как идентифицируемая финансовая или медицинская информация. Наконец, Google может наказывать страницы, использующие черные методы SEO.
Как я могу повторно проиндексировать свой контент, если он был удален?
Вы можете попросить Google переиндексировать ваш контент, изменив его в соответствии с рекомендациями поисковой системы по обеспечению качества для веб-мастеров. Затем вы можете отправить запрос на пересмотр и дождаться ответа Google.
Как запретить поисковым системам индексировать определенные страницы?
Вы можете запретить поисковым системам индексировать определенные страницы, добавив метатег noindex к странице 9раздел 0064. Кроме того, если ваш контент представляет собой медиафайл, вы можете добавить его в файл robots.txt . Наконец, Инструменты Google для веб-мастеров позволяют скрыть страницу с помощью инструмента «Удалить URL-адреса».
Заключение
SEO — это широкая область, которая охватывает все, от алгоритмов поисковых систем до методов внешней оптимизации. Если вы новичок в этой теме, вы можете чувствовать себя ошеломленным всей информацией. К счастью, индексирование — одна из самых простых концепций для понимания.
Индексация поисковыми системами — это важный процесс, который упорядочивает содержимое вашего веб-сайта в центральной базе данных. Сканеры поисковых систем анализируют содержимое и архитектуру вашего сайта, чтобы классифицировать его. Затем они могут ранжировать ваши страницы на своих страницах результатов по определенным условиям поиска.
У вас есть другие вопросы об индексации поисковыми системами? Дайте нам знать в комментариях ниже!
Избранное изображение через Sammby / Shutterstock.com
Подробное руководство по работе поиска Google | Центр поиска Google | Документация
Поиск Google – это полностью автоматизированная поисковая система, использующая программное обеспечение, известное как поисковые роботы. регулярно исследуйте Интернет, чтобы найти страницы для добавления в наш индекс. На самом деле, подавляющее большинство страницы, перечисленные в наших результатах, не отправляются вручную для включения, а обнаруживаются и добавляются автоматически, когда наши поисковые роботы исследуют Интернет. Этот документ объясняет этапы того, как Поиск работает в контексте вашего сайта. Наличие этих базовых знаний может помочь вам исправить проблем со сканированием, проиндексируйте свои страницы и узнайте, как оптимизировать внешний вид вашего сайта в Поиск Гугл.
Ищете что-то менее техническое? Проверьте наши сайт «Как работает поиск», который объясняет, как работает поиск с точки зрения пользователя.Несколько замечаний, прежде чем мы начнем
Прежде чем мы углубимся в детали работы Поиска, важно отметить, что Google не принимать оплату, чтобы чаще сканировать сайт или повышать его рейтинг. Если кто-нибудь скажет вам в противном случае они ошибаются.
Google не гарантирует, что он будет сканировать, индексировать или обслуживать вашу страницу, даже если она следует Правила и политика Google для владельцев сайтов.
Знакомство с тремя этапами поиска Google
Поиск Google работает в три этапа, и не все страницы проходят каждый этап:
- Сканирование: Google загружает текст, изображения и видео со страниц, найденных в Интернете с помощью автоматических программ, называемых поисковыми роботами.
- Индексирование: Google анализирует текст, изображения и видеофайлы на странице и сохраняет информацию в индексе Google, который является большим база данных.
- Подача результатов поиска: Когда пользователь ищет на Google, Google возвращает информацию, относящуюся к запросу пользователя.
Ползание
Первый этап — выяснить, какие страницы существуют в Интернете. Нет центрального реестра все веб-страницы, поэтому Google должен постоянно искать новые и обновленные страницы и добавлять их в свои список известных страниц. Этот процесс называется «обнаружение URL». Некоторые страницы известны, потому что Гугл их уже посещал. Другие страницы обнаруживаются, когда Google переходит по ссылке из известной страницы на новую страницу: например, центральная страница, такая как страница категории, ссылается на новую Сообщение блога. Другие страницы обнаруживаются, когда вы отправляете список страниц ( карта сайта) для сканирования Google.
Как только Google обнаружит URL-адрес страницы, он может посетить (или «просканировать») страницу, чтобы узнать, что находится на ней. Это. Мы используем огромное количество компьютеров для сканирования миллиардов страниц в Интернете. Программа, которая выборка называется Googlebot (также известный как робот, бот или паук). Googlebot использует алгоритмический процесс для определения какие сайты сканировать, как часто и сколько страниц получать с каждого сайта. Поисковые роботы Google также запрограммированы таким образом, что стараются не сканировать сайт слишком быстро, чтобы не перегружать его. Этот механизм основан на ответах сайта (например, Ошибки HTTP 500 означают «медленнее») а также настройки в Search Console.
Однако робот Googlebot не сканирует все обнаруженные страницы. Некоторые страницы могут быть
запрещен для сканирования
владельца сайта, другие страницы могут быть недоступны без авторизации на сайте, и другие
страницы могут быть дубликатами ранее просканированных страниц.
Например, многие сайты доступны через www ( www.example.com
) и
версия доменного имени без www ( example. com
), даже если содержимое
идентичен для обеих версий.
Во время сканирования Google отображает страницу и запускает любой найденный JavaScript используя последнюю версию Chrome, аналогично тому, как ваш браузер отображает страницы, которые вы посещаете. Рендеринг важен, потому что веб-сайты часто полагаются на JavaScript для отображения контента на странице. и без рендеринга Google может не увидеть этот контент.
Сканирование зависит от того, могут ли поисковые роботы Google получить доступ к сайту. Некоторые распространенные проблемы с Доступ к сайтам робота Googlebot включает:
- Проблемы с сервером, обрабатывающим сайт
- Проблемы с сетью
- директивы robots.txt, запрещающие роботу Googlebot доступ к странице
Индексация
После сканирования страницы Google пытается понять, о чем эта страница. Этот этап
называется индексированием и включает в себя обработку и анализ текстового контента и ключевого контента
теги и атрибуты, такие как <название>
элементов
и атрибуты alt,
картинки,
видео и
более.
В процессе индексации Google определяет, является ли страница дубликат другой страницы в Интернете или канонической. Каноническая — это страница, которая может отображаться в результатах поиска. Для выбора канонического мы сначала сгруппируем найденные в Интернете страницы с похожим содержанием, а затем выберите тот, который наиболее репрезентативен для группы. Остальные страницы в группе альтернативные версии, которые могут подаваться в разных контекстах, например, если пользователь ищет с мобильного устройства или они ищут очень конкретную страницу из этого кластера.
Google также собирает сигналы о канонической странице и ее содержании, которые могут использоваться в следующий этап, где мы обслуживаем страницу в результатах поиска. Некоторые сигналы включают язык страницы, страны, в которой находится контент, удобство использования страницы и т. д.
Собранная информация о канонической странице и ее кластере может храниться в Google index, большая база данных, размещенная на тысячах компьютеров. Индексация не гарантируется; не каждый страница, которую обрабатывает Google, будет проиндексирована.
Индексация также зависит от содержания страницы и ее метаданных. Некоторые распространенные проблемы с индексацией может включать:
- Качество контента на странице низкое
- Метадирективы robots запрещают индексацию
- Дизайн сайта может затруднить индексацию
Обслуживание результатов поиска
Google не принимает плату за повышение ранжирования страниц, а ранжирование выполняется программно.Когда пользователь вводит запрос, наши машины ищут в индексе соответствующие страницы и возвращают результаты, которые мы считаем, являются самыми качественными и наиболее релевантными для пользователя. Релевантность определяется сотнями факторов, которые могут включать в себя такую информацию, как местоположение, язык и устройство (рабочий стол или телефон). Например, при поиске «ремонт велосипедов магазины» покажет пользователю в Париже разные результаты, чем пользователю в Гонконге.
Search Console может сказать вам, что страница проиндексирована, но вы не видите ее в результатах поиска. Это может быть потому, что:
- Содержание контента на странице не имеет отношения к пользователям
- Качество контента низкое
- Мета-директивы robots предотвращают обслуживание
Хотя в этом руководстве объясняется, как работает Поиск, мы постоянно работаем над улучшением наших алгоритмов. Вы можете отслеживать эти изменения, следуя Блог Google Search Central.
Как заставить поисковые системы индексировать нужный контент для лучшей видимости
Структура и содержание веб-сайта могут оказать значительное влияние на способность поисковых систем обеспечивать удобство поиска. В результате индустрия поисковой оптимизации эволюционировала, чтобы обеспечить лучшее понимание этих воздействий и закрыть критические пробелы. Некоторые элементы на вашем веб-сайте будут активно мешать поиску, и этот пост покажет вам, как настроить таргетинг на ценный контент и исключить отвлекающие факторы.
Мы написали статью о файлах robots.txt, в которой рассказали о высоком уровне включения и исключения контента из поисковых систем. Есть и другие ключевые инструменты, которые вы захотите использовать на своем веб-сайте для дальнейшего таргетинга контента на отдельных страницах:
.- Элемент
- Канонические ссылки
- Метатеги роботов
- Или комбинация вышеперечисленного: Пример структуры кода для динамических списков и архивного события
<основной>
элементОриентация на определенный контент на странице
Элемент
позволяет вам ориентироваться на контент, который вы хотите проиндексировать поисковыми системами. Если присутствует элемент
, система будет собирать содержимое только внутри элемента. Убедитесь, что контент, который вы хотите проиндексировать, находится внутри этого элемента. Если элемент будет закрыт слишком рано, важный контент не будет проиндексирован. Если система не найдет
, определяющий, где находится основной контент страницы, или другие маркеры семантических разделов, повторяющийся контент, такой как заголовки, нижние колонтитулы и боковые панели, могут быть обнаружены поисковыми системами как часть контента страницы. Мы рекомендуем добавить
и другие семантические элементы, такие как
, и
, чтобы разграничить эти разделы и упростить индексацию.
Элемент реализован как отдельный тег:
<тело> Избыточный код заголовка и элементы навигации, боковые панели и т. д. <основной>Это название вашей страницы
Это основной текст вашей страницы главная> Избыточный код нижнего колонтитула Различные скрипты и т. д. тело>
Элемент также может принимать форму Это основной текст вашей страницы
Если возможно, откройте тег Если элемент Есть две веские причины для объявления URL-адреса данной страницы: сайты CMS могут легко стать ловушками для сканеров, а списковые представления могут генерировать URL-адреса, которые бесполезны в качестве результатов поиска. Ловушка сканера возникает, когда движок попадает в цикл посещения, открытия и «обнаружения» страниц, которые кажутся новыми, но являются модификациями существующих URL-адресов. Эти URL-адреса могут иметь добавленные параметры, такие как теги, ссылающиеся страницы, токены Диспетчера тегов Google, номера страниц и т. д. Ловушки сканера обычно возникают, когда ваш сайт может генерировать бесконечное количество URL-адресов. Поисковый робот в конечном итоге не может определить, что представляет собой весь сайт. Используя каноническую ссылку, показанную выше, вы сообщаете сканеру, что это реальный URL-адрес страницы, несмотря на параметры, присутствующие в URL-адресе при открытии страницы. В приведенном выше примере, даже если сканер открыл страницу с URL-адресом вида Еще одним важным вариантом использования канонических ссылок является динамический список. Если приведенный выше пример представляет собой динамический список страниц по теме 1, скорее всего, внизу страницы будет нумерация страниц. Эта разбивка на страницы динамически разделяет элементы на отдельные страницы и генерирует такие URL-адреса, как: Используйте каноническую ссылку, чтобы поисковая система могла индексировать только первую страницу списка, которую пользователь затем может сортировать или перемещать по своему выбору. Отдельные элементы в списке индексируются отдельно и включаются в результаты поиска. На ваших веб-сайтах есть отдельные страницы, которые не дают хороших результатов поиска. Это могут быть заархивированные страницы событий, представления списков, такие как недавние сообщения в блоге и т. д. Заблокировать отдельные страницы в файле robots.txt будет сложно, если у вас нет простого доступа к редактированию файла. привести к неуправляемо длинному Также важно отметить, что поисковые системы будут обращать внимание на директивы Чтобы добиться наилучших результатов при блокировке индексации определенных страниц, вам нужно использовать метатеги robots в В этом примере указано не индексировать страницу, но разрешается переход по ссылкам на странице: В этом примере предлагается проиндексировать страницу, но не переходить ни по одной из ссылок на странице: Этот пример указывает ботам не индексировать страницу и не переходить ни по одной из ссылок на странице: Вы также можете добавить тег X-Robots-Tag к ответу заголовка HTTP для управления индексацией данной страницы. Для этого требуется более глубокий доступ к серверам, чем обычно имеют сами наши клиенты, поэтому, если вы хотите узнать больше, вы можете сделать это здесь. Если у вас есть контент, который должен быть проиндексирован, когда он свежий, но его нужно удалить из индекса, как только он устарел, вам нужно выполнить несколько действий: Следующий пример кода предназначен для динамически создаваемого списка страниц на вашем сайте, где вы хотите, чтобы целевая страница списка отображалась в результатах поиска. Это вводный текст страницы. Он сообщает людям, что они здесь найдут, почему тема важна и т. д. Этот текст находится в основном элементе, поэтому он будет использоваться для извлечения этой страницы при поиске.
главная>
Динамически генерируемый список релевантных страниц
Пагинация
Различные скрипты и т.д.
тело>
Следующий пример кода предназначен для динамически генерируемого списка страниц вашего сайта, когда вы не хотите, чтобы этот список отображался в результатах поиска. В случае страниц, помеченных определенным термином, сами страницы будут хорошими результатами поиска, но их список будет просто еще одним щелчком между пользователем и контентом. Примечание: теги описания все еще присутствуют на тот случай, если кто-то ссылается на эту страницу в другой системе, и эта система хочет отобразить сводку со ссылкой. В следующем примере страница события была опубликована в июне, а затем обновлена на следующий день после события. Это обновление добавляет метатег Это вводный текст страницы. Он сообщает людям, что они здесь найдут, почему тема важна и т. д. Этот текст находится в основном элементе, поэтому он будет использоваться для извлечения этой страницы при поиске.
Подробности о мероприятии.
главная>
Различные скрипты и т.д.
тело>
Представьте, что вы вводите поисковый запрос в Google и все ждете и ждете, пока ваши результаты медленно появятся на экране. Вы, вероятно, нажмете кнопку обновления или переключитесь на другой веб-сайт. В эпоху стремительного интернета никому не хочется тратить время на ожидание поискового запроса. Этот сценарий является гипотетическим, поскольку поисковые системы в настоящее время работают очень быстро . В течение нескольких секунд они отображают результаты вашего поиска после того, как вы ввели поисковый запрос. Чтобы сделать вашу работу в качестве пользователя такой гладкой, поисковые системы используют так называемые поисковые индексы для возврата результатов по запросу. Несмотря на то, что мы привыкли получать быстрые результаты в Google и других популярных поисковых системах, часто внутренний поиск по сайту не дает результатов так же быстро. Без поискового индекса поисковый запрос потребляет ресурсы сервера и замедляет работу сайта. Вот почему поисковый индекс является жизненно важной частью любого хорошего варианта поиска по сайту. Содержание Поисковый индекс помогает пользователям быстро находить информацию на веб-сайте. Он предназначен для сопоставления поисковых запросов с документами или URL-адресами, которые могут отображаться в результатах. Звучит сложно? Вот более простой способ описать это: Возможно, вы уже встречали указатель на более традиционном носителе: книги . Многие большие (научные) книги имеют указатель, который поможет вам найти нужную информацию за считанные секунды. Обычно в конце книги находится указатель, который включает список ключевых слов, организованных в алфавитном порядке. Каждое ключевое слово указывает на страницу, на которой можно найти полезную информацию о ключевом слове. Например, у вас может быть книга о животных с несколькими сотнями страниц. Вы хотите найти информацию о «кошках». В указателе вы бы искали ключевое слово «кошка» и читали страницы, которые упоминаются (стр. 17, 89, 203-205). Индекс поиска очень похож на индекс книги. Позволяет пользователю быстро найти полезную информацию по ключевому слову. Конечно, индекс веб-поиска имеет много технологических преимуществ по сравнению с индексом в книге и предлагает отличные инструменты, помогающие посетителям веб-сайтов быстрее получать то, что они хотят. Индексы для книг традиционно создаются автором(ами), редакторами, а также профессионалами, специализирующимися на индексировании, так называемыми индексаторами. Анализируя содержание книги, они определяют ключевые слова и следят за тем, чтобы они указывали на наиболее релевантные страницы книги. Программное обеспечение автоматизирует процесс индексации. Поисковый индекс для веб-сайтов создается сканерами , также известными как веб-сканеры и веб-пауки. Проще говоря, сканер посещает страницы веб-сайта и собирает содержимое с веб-сайта. Затем эти данные преобразуются в индекс. Возвращаясь к нашему примеру, если вы ищете «кошка» в Google, вам будет представлено несколько страниц и URL-адресов, релевантных вашему ключевому слову «кошка». В то время как книжный индекс является статическим, поскольку содержание книги не меняется, поисковый индекс является динамическим, поскольку веб-сайты постоянно создаются и обновляются. Кроме того, количество условий поиска в индексе книги является фиксированным. Веб-поиск пытается включить все ключевые слова и поддерживает запросы с комбинированными условиями поиска. Например, вы можете искать «видео с кошками», и индекс поиска предложит соответствующие результаты. Когда пользователь вводит поисковый запрос, поисковая система находит документы, содержащие поисковый запрос. Результаты возвращаются из индекса с title , короткое выделение контента , возможно изображение и ссылка на URL страницы . Некоторые CMS предлагают встроенные средства поиска, которые посещают собственную базу данных CMS. Поскольку база данных не организована как индекс, результаты будут отображаться медленнее, чем при поиске по сайту на основе индекса. Поисковые системы автоматически собирают содержимое вашего веб-сайта . Благодаря алгоритму ваши результаты поиска имеют приоритет. Некоторым результатам будет придан больший вес, поэтому они будут отображаться перед другими страницами на странице результатов. При выборе службы поиска по сайту вы можете улучшить результаты поиска с помощью различных функций. Начните бесплатную 14-дневную пробную версию с AddSearch. Существуют три основные функции для управления рейтингом и его корректировки в AddSearch: области сайта, закрепленные результаты и рекламные акции. Области сайта: С помощью функции области сайта вы можете выбрать, какие области вашей веб-страницы вы хотите повысить, а какой контент вы хотите сделать менее важным. Например, вы можете захотеть, чтобы ваши статьи поддержки показывались перед любыми статьями блога, если ваш пользователь с большей вероятностью найдет соответствующую информацию в «поддержке». Вы также можете вообще исключить определенные страницы из результатов поиска, например целевые страницы или страницы авторов. Эта функция влияет только на внутренний поиск по сайту, но не на ваш поиск в Google. Закрепленные результаты: Вы можете закрепить определенный контент, чтобы он отображался в верхней части страницы результатов. Сначала вы выбираете ключевое слово, а затем выбираете страницу, которая должна отображаться первой. Можно закрепить несколько страниц и соответственно упорядочить их. Эта функция отображается как обычный результат, поэтому ваши пользователи не будут знать, что они смотрят на закрепленный результат. Рекламные акции: Подобно закрепленному результату, рекламная акция будет отображаться первой на странице результатов. Акции могут быть выбраны для нескольких ключевых слов и страниц. Кроме того, вы можете использовать несколько элементов дизайна, таких как цвет фона, чтобы сделать продвижение визуально привлекательным для вашего посетителя. Акции могут быть временными, например, для специального рождественского предложения. Вы можете персонализировать результаты для каждого посетителя сайта. Благодаря персонализации пользователи могут видеть результаты поиска на основе своих предпочтений и истории просмотров. Все пользователи приходят на веб-сайт с разными целями, и, хотя кажется, что они выполняют поиск по одному и тому же ключевому слову, ожидаемые результаты могут сильно различаться. Например, если посетитель сайта, который, как известно, является вегетарианцем, ищет «рецепт пасты», результаты поиска могут сразу же дать информацию о вегетарианском соусе, в то время как вы порекомендуете мясоеду болоньезе. Пользовательские результаты более релевантны, а более качественные результаты поиска улучшают взаимодействие с пользователем на вашем веб-сайте, повышают его удовлетворенность и, как следствие, увеличивают число конверсий. На персонализацию может влиять что угодно, от определенного просмотра страницы до предпочтительных параметров поиска, информации об учетной записи или истории покупок. AddSearch также предоставляет владельцам сайтов рекомендации по настройке параметров персонализации, чтобы убедиться, что опыт удовлетворяет потребности каждого пользователя. Если вы заинтересованы в этом, вы можете связаться с нашим отделом продаж. Если вы хотите настроить свой пользовательский интерфейс на более продвинутый и персонализированный дизайн для поиска по сайту, вы можете использовать AddSearch для сканирования вашего сайта и предоставления поискового индекса, но кодируйте свой собственный дизайн. Этот индивидуальный подход отлично подходит для оформления страницы результатов поиска в соответствии с уникальными потребностями и желаниями вашего посетителя. Одним из вариантов является предоставление индексирующего API для сканера. С помощью этого метода результаты могут постоянно обновляться новым поступающим контентом. Это решение имеет смысл, если на вашем веб-сайте есть прямые трансляции или постоянно обновляемый контент (например, новостные сайты или видеоплатформы). С помощью Analytics вы можете увидеть, что ищут ваши пользователи, и дать им именно то, что они хотят. Вы можете получить ценную информацию о том, как ваши пользователи используют поиск: как часто ваши пользователи выполняют поиск, что они ищут и находят ли они это. С помощью этой информации вы можете создавать контент, чтобы предоставить своим пользователям именно то, что они просят. Аналитика включает такую информацию, как ваши самых популярных ключевых слов , ключевых слов без кликов или ключевых слов не возвращает никаких результатов . AddSearch поддерживает Google Analytics, Adobe Analytics и Matomo, поэтому вы можете интегрировать всю свою аналитику в одном месте. Подобно редактору книги, который подбирает ключевые слова для указателя, все эти функции предлагают персонализированный «человеческий контакт», чтобы сделать результаты поиска еще лучше. Подводя итог, мы увидели некоторое сходство и некоторые различия между индексами книжного и поискового систем. <тело>
Избыточный код заголовка и элементы навигации, боковые панели и т. д.
Это название вашей страницы
непосредственно перед тегом для заголовка страницы. Если вы используете на своем сайте навигационные крошки,
следует поместить между навигационными цепочками и
, чтобы повторяющийся текст в навигационных ссылках не индексировался.
отсутствует, мы опустим элементы и
. Если ни один из них не присутствует, вся страница будет очищена. Очистка всей страницы лучше всего работает для типов файлов, отличных от HTML, включая PDF и DOC, поэтому мы рекомендуем вам реализовать эти семантические элементы в шаблонах страниц, чтобы помочь поисковым системам понять структуру вашего сайта.
Объявить «настоящий» URL для страницы
https://example.gov/topic1?sortby=desc
, только https://www.example.gov/topic1
будут захвачены поисковая система. https://example.gov/topic1?page=3
. Когда новые элементы добавляются в список или удаляются из него, нет никакой гарантии, что существующие элементы останутся на определенной странице. Такое поведение может расстраивать пользователей, когда на определенной странице больше нет нужного им элемента. Метатеги роботов
Исключить определенные страницы из индексации или запретить переход по их ссылкам
robots.txt
. Disallow
в robots.txt
при сканировании, но не при доступе к вашим URL-адресам из других источников, таких как ссылки с других сайтов или ваша карта сайта. Search.gov будет полагаться на метатеги роботов при работе с вашей картой сайта, чтобы знать, какой контент вы хотите использовать для поиска, а какой нет.
страниц, которые вы хотите исключить из поискового индекса.
к
страницы. Пример структуры кода
Динамический список 1: Тематическая целевая страница
<голова>
Уникальный заголовок страницы
Динамический список 2: сообщения с тегами XYZ
<голова>
Уникальный заголовок страницы
Динамически генерируемый список релевантных страниц
главная>
Пагинация
Различные скрипты и т.д.
тело>
Событие последнего месяца
robots
, который объявляет, что страница не должна быть проиндексирована, а ссылки со страницы не должны переходить при сканировании в будущем. Опять же, метаописания сохраняются в случае ссылки из других систем. <голова>
Уникальный заголовок страницы
Ресурсы
Что такое поисковый индекс и как он работает?
Что такое поисковый индекс?
Как создаются поисковые индексы?
Как результаты поиска возвращаются из индекса?
Как поисковый индекс может улучшить ваш веб-сайт
Управление результатами и корректировка рейтинга
Персонализация
Пользовательский интерфейс и API поиска
Analytics
Заключение