Сайт

Xml карта сайта что это: что это, зачем она нужна, и как её создать – Блог Netpeak Software

03.12.2022

Содержание

подробное описание формата, примеры создания XML карты сайта

Комментарии: 0

 17773

16.10.2018 | Время чтения: 12 минут

Автор: Симагин Андрей

Многие из вас слышали про необходимость наличия у сайта карты Sitemap (он же «сайтмап»), однако не все до конца понимают важность его присутствия на сайте. В данной статье мы проведем обзор файла формата Sitemap.xml, а также опишем варианты его генерации для различных типов сайтов.

Структура статьи:

  • Для чего нужна карта сайта
  • Описание формата Sitemap
  • Маскирование символов
  • Разбиение Sitemap на части
  • Местоположение Sitemap.xml и его индексация
  • Использование кириллических адресов
  • Вопросы необходимости карты сайта
  • Обзор вариантов генерации Sitemap.xml

Для чего нужна карта сайта Sitemap.xml

Карта сайта Sitemap – это файл XML либо текстового формата (TXT), содержащий в себе все URL сайта (ссылки на страницы либо изображения) и предназначенный для сообщения поисковым роботам информации о новых страницах на вашем ресурсе.

В результате обхода по всем URL в сайтмап, поисковая система перейдет по всем актуальным страницам вашего сайта.

Конечно, поисковые системы проиндексируют ваш сайт и без сайтмапа, и зачастую сделают это не менее качественно, однако в некоторых случаях у поисковиков могут возникнуть сложности с индексацией страниц. Основными причинами неиндексации могут быть такие факторы, как:

  • сайт имеет большую вложенность страниц (характерно для крупных веб-ресурсов)
  • сайт имеет страницы без навигационных ссылок (на страницы невозможно перейти по внутренней навигации сайта)
  • на сайте присутствуют динамические URL

Для подобных страниц из вышеописанных вариантов робот может не добраться никогда, так как в первом случае из-за глубокой вложенности он просто не дойдет до конечного URL, исчерпав краулинговые лимиты сайта, а во втором он физически их не увидит, так как не сможет на них перейти по ссылкам на сайте (например, это может быть вариант, когда ссылка есть, но проставлена при помощи JavaScript, CSS-стилем либо просто зашифрована, из-за чего в исходном коде страницы поисковый робот ее просто не увидит).

Однако, имея информацию о наличии файла Sitemap.xml, поисковый робот будет периодически его обходить и индексировать новые страницы сайта в нужном вам порядке, с необходимым приоритетом и именно по тем страницам, которые вам наиболее важны в данный момент.

Описание формата Sitemap

Sitemap может быть двух типов: текстового формата (TXT) и формата XML.

Текстовый формат представляет собой простой текстовый файл кодировки UTF-8 и содержащий в себе URL сайта в виде наборов строк (каждая ссылка с новой строки). Пример карты сайта текстового формата:

https://www.site.ru/page-1.html
https://www.site.ru/page-2.html

Формат XML является расширенным форматом текстового варианта и позволяет передавать поисковым ботам дополнительную информацию. Пример файла Sitemap.xml:

<?xml version="1.0" encoding="UTF-8"?>
    <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
        <url>
            <loc>http://www. site.ru/</loc>
            <lastmod>2018-10-03</lastmod>
            <changefreq>monthly</changefreq>
            <priority>1.0</priority>
        </url>
        <url>
            <loc>http://www.site.ru/page-1.html</loc>
            <lastmod>2018-10-03</lastmod>
            <changefreq>monthly</changefreq>
            <priority>0.9</priority>
        </url>
        <url>
            <loc>http://www.site.ru/page-2.html</loc>
            <lastmod>2018-10-03</lastmod>
            <changefreq>monthly</changefreq>
            <priority>0.9</priority>
        </url>
        ...
        <url>
            <loc>http://www.site.ru/page-N.html</loc>
            <lastmod>2018-10-03</lastmod>
            <changefreq>monthly</changefreq>
            <priority>0.
9</priority> </url> </urlset>

Описание элементов XML, на которые необходимо обратить внимание:

  • url (обязательный параметр) – содержит все сведения о конкретном URL
    • loc (обязательный параметр) – URL страницы. Для URL с параметрами необходимо маскирование
    • lastmod – дата и время последнего изменения страницы в формате Datetime. При необходимости допускается опустить сегмент времени и использовать формат ГГГГ-ММ-ДД
    • changefreq – указание рекомендательной частоты изменения страницы. Может принимать значения: always, hourly, daily, weekly, monthly, yearly, never
    • priority – значимость страницы относительно других URL сайта. Допустимый диапазон значений 0.0 до 1.0. Чем страница важнее, тем приоритет больше. У главной страницы приоритет всегда равен 1, по умолчанию приоритет 0.5

Примечание: стоит упомянуть, что содержимое карты сайта является лишь рекомендацией поисковым роботам по обходу страниц (если установить периодичность обхода страниц раз в неделю, то робот может их обходить гораздо чаще, и наоборот, если установить частоту обхода ежечасно, то это не значит, что поисковики будут индексировать страницу каждый час).

Прочие форматы XML карты сайта:

  • Файл Sitemap для изображений
    • Отдельный сайтмап для изображений будет полезен, если изображения не доступны боту напрямую (например, если они загружаются с помощью JavaScript). Однако, зачастую, для этого можно использовать обычный Sitemap.xml и указывать в нем ссылки на изображения вместе с обычными URL. Подробнее о сайтмап для изображений в справке Google
  • Файл Sitemap для новостей
    • Используется для быстрой индексации новостных материалов вашего сайта, при этом ваш ресурс должен быть включен в каталог Google Новости. Требования к Sitemap: должен содержать не более 1000 URL, должен содержать URL новостей, опубликованных за последние два дня. Подробнее о сайтмап для новостей в справке Google

Маскирование

Маскирование в Sitemap.xml используется для URL-адресов и предназначено для интерпретации обычных символов в их псевдокоды в формате HTML:

  • Амперсанд: & -> &amp;
  • Одинарные кавычки: ‘ -> &apos;
  • Двойные кавычки: » -> &quot;
  • Больше: > -> &gt;
  • Меньше: < -> &lt;

Таким образом, всем привычный URL с параметрами и не маскированными спецсимволами по стандартам XML будет невалиден, пример:

Стандартный URL страницы (не валидный)

https://www. site.ru/index.php?page=news&date=22071981

Валидный URL в Sitemap с маскированием (символ «&» заменен на «&amp;»)

<loc>https://www.site.ru/index.php?page=news&amp;date=22071981</loc>

Для символов в URL, отличных от ASCI, помимо & также необходимо применять маскирование. Пример для URL-адреса:

http://www.site.ru/контакты.html

Тот же URL-адрес с использованием маскирования, для размещения в Sitemap:

http://www.site.ru/%D0%BA%D0%BE%D0%BD%D1%82%D0%B0%D0%BA%D1%82%D1%8B.html

Разбиение Sitemap на составные части

У файла Sitemap.xml есть ограничение как на объем содержащихся в нем URL, так и на сам размер файла. В каждом файле Sitemap.xml должно содержаться не более 50 000 URL, а его объем не должен превышать 50 Мб для Google и 10 Мб для Яндекса (при необходимости файл можно сжать в формат «gzip», но, тем не менее, в распакованном виде он также не должен превышать размер в 50 мегабайт), поэтому при необходимости указания более 50 000 URL-адресов, следует создать несколько файлов Sitemap.

Таким образом, за счет возможности разбиения Sitemap на части, можно обойти все эти ограничения и спокойно генерировать Sitemap для десятков и сотен тысяч страниц.

Разбиение происходит путем создания основного индексного файла Sitemap.xml, содержащего ссылки на дочерние файлы, которые в свою очередь являются стандартными файлами Sitemap.xml и содержат список конечных URL вашего сайта. В основном индексном файле для указания ссылок на дочерние сайтмап используется все тот же тег <loc>, обрамленный тегом <sitemap>, и содержащий ссылки на дочерние Sitemap.xml (названия дочерних сайтмап можно указывать произвольно).

Пример индексного файла XML Sitemap:

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <sitemap>
      <loc>http://www.site.ru/sitemap-1.xml</loc>
      <lastmod>2018-09-25T21:38:17+00:00</lastmod>
   </sitemap>
   <sitemap>
      <loc>http://www. site.ru/sitemap-2.xml</loc>
      <lastmod>2018-09-21</lastmod>
   </sitemap>
</sitemapindex>

Формат дочерних файлов карт сайта XML-формата аналогичен стандартным Sitemap.xml.

Местоположение Sitemap.xml и его индексация

Стандартным вариантом размещения сайтмап является корень сайта, пример:

https://www.site.ru/sitemap.xml

При размещении «sitemap.xml» необходимо учитывать тот факт, что набор URL-адресов, которые можно включить в Sitemap определяется именно расположением на сайте, то есть при размещении карты сайта по адресу http://site.ru/news/sitemap.xml она может включать только URL-адреса, начинающиеся с http://site.ru/news/, но не должен включать адреса, начинающиеся с http://site.ru/pages/. Примеры допустимых URL для http://site.ru/news/sitemap.xml:

http://site.ru/news/25092018/
http://site.ru/news/news-all/

К недопустимым URL-адресам в файле http://site.ru/news/sitemap.xml относятся:

http://site. ru/pages/page-1/
http://site.ru/images/1x1.gif
http://site.ru/contacts/

Таким образом, во избежание проблем с некорректной индексацией, настоятельно рекомендуется размещать Sitemap.xml в корне сайта.

Индексация Sitemap

Поисковые роботы по умолчанию сканируют корневую директорию сайта, поэтому со временем они найдут ваш сайтмап и перейдут по всем его ссылкам.

Однако, для ускорения посещения файла Sitemap поисковыми ботами необходимо выполнить несколько шагов:

  • разместить ссылку на карту сайта в файле «robots.txt»
  • добавить ссылку на «sitemap.xml» в панели вебмастера Яндекс и Google

Ссылка на сайтмап в «robots.txt»

User-agent: *
...
Sitemap: https://site.ru/sitemap.xml

Добавление сайтмап в панели вебмастера Яндекс и Google

Использование кириллических адресов

Для корректной интерпретации URL различными поисковыми системами рекомендуется все кириллические URL кодировать в формат Punycode (бесплатный конвертер) и использовать маскирование для кириллических адресов страниц.

То есть, вместо адреса:

http://www.ёэлектроника.рф/каталог/лампы/

Необходимо использовать кодированный URL:

http://www.xn--80ajjhbcqhrt1jzb.xn--p1a/%D0%BA%D0%B0%D1%82%D0%B0%D0%BB%D0%BE%D0%B3/

Вопрос необходимости карты сайта

Бесспорно, что присутствие карты сайта желательно на любом сайте. Но, с одной стороны, в сайтмапе нет острой необходимости, так как со временем поисковый робот перейдет на ваш сайт и по ссылкам просканирует все доступные ему страницы. С другой стороны, для сайтов, у которых контент обновляется часто и которым важен порядок и приоритет обхода страниц (СМИ, новостные агентства, etc.), данный файл будет жизненно необходим, так как с помощью него они смогут указать поисковым роботам какие страницы индексировать в первую очередь, а какие после.

Поэтому, возникает справедливый вопрос: а так ли необходим Sitemap.xml конкретно для вашего сайта? Давайте разбираться.

Безусловно, данный файл будет актуален для сайтов объемом от 1000 страниц, а также для тех сайтов, объем страниц которых растет быстро и контент на которых нуждается в частой переиндексации, поэтому за счет данного файла поисковая система будет иметь под рукой всегда актуальный список страниц вашего сайта и с помощью него же будет своевременно индексировать все изменения. Таким образом, актуален данный файл для сайтов, контент на которых меняется часто и большими объемами (добавилось 50 страниц, удалилось 40, обновилось 175 и т.д.):

  • СМИ, новостные порталы
  • интернет-порталы
  • каталоги товаров, агрегаторы
  • интернет магазины
  • форумы, отзовики, сайты вопросов-ответов

Для подобных сайтов данный файл необходимо иметь в первую очередь, так как от него зависит актуальность представляемой информации в выдаче поисковых систем.

Пример индексации через сайтмап при добавлении на сайт большого числа страниц:

Примечание: файлы Sitemap в таком случае необходимо генерировать на стороне сервера. Генерация карты сайта онлайн при помощи сервисов либо программ для ПК бессмысленна за счет низкой скорости и трудоемкости работ по выкладыванию данных файл на сервер (для крупных порталов, каталогов и интернет-магазинов подобные файлы должны обновляться чуть ли не каждый час (например, обновление цен в интернет-магазине)).

Вторая категория сайтов, для которых также необходим данный файл – это сайты от 100 до 1000 страниц и представляющие услуги бизнеса, а также просто информационные странички:

  • сайты по продаже товаров и услуг
  • сайты компаний и представительств
  • блоги

На подобных сайтах обычно приток новых страниц происходит плавно, удаление страниц и разделов случается еще реже. Поэтому само собой подобные сайты должны иметь файлы Sitemap XML, однако в данном случае данный файл больше важен для первичной индексации сайта (чтобы за один обход файла поисковый робот узнал про все страницы сайта и оперативно их проиндексировал). Далее, новые страницы в виду их единичного добавления можно отсылать на переиндексацию даже через панель вебмастера Яндекса или Google и таким образом поддерживать актуальность страниц для поисковых систем. Файлы Sitemap для подобного рода сайтов можно генерировать специальными программами и сервисами, о которых будет написано ниже.

Третья категория сайтов – сайты с числом страниц до 100. К ним относятся:

  • лендинги (одностраничные сайты для продажи конкретного товара либо услуги)
  • промо-сайты (например, сайты коттеджных поселков)
  • сайты-визитки
  • домашние странички

Все эти сайты зачастую содержат небольшое число страниц о какой-то одной услуге, товаре, событии. Для подобного рода сайтов в наличии Sitemap нет какой-то жизненно важной необходимости. Так как контент на них обновляется достаточно редко и новые страницы добавляются с низкой интенсивностью, поисковые роботы такие сайты обходят не часто в виду малого числа страниц на них, поэтому для данных сайтов вполне подойдет как использование Sitemap.xml, так и его предшественника HTML карты сайта – это обычная HTML-страница стилизованная под дизайн сайта, на которой размещены все ссылки на внутренние страницы сайта в иерархическом виде (обычно в виде дерева). Таким образом, поисковый робот, посетив эту страницу, может обойти все страницы сайта и проиндексировать их либо обновить о них информацию. Пример такой страницы:

Примечание: на текущий момент создание подобных страниц перестало быть актуальным в виду перехода на формат XML, который не нужно создавать руками, а можно сгенерировать специальными программами либо сервисами (их примеры представлены ниже).

Таким образом, из всех вышеизложенных заключений можно сделать простой вывод, что чем больше объем страниц вашего сайта и чем чаще он обновляется, тем острее необходимость наличия на нем карты сайта Sitemap.xml, который в идеале должен генерироваться на сервере автоматически, без участия человека.

Важно!
Сайтмап должен включать в себя только актуальные страницы сайта необходимые для индексации и отдающие код ответа сервера 200. Все прочие служебные, технические либо страницы, запрещенные к индексации, не должны присутствовать в карте сайта.

Варианты генерации Sitemap.xml

Существует несколько методов генерации, перечислим их:

1. Генерация карты сайта при помощи онлайн-генератора (стоит учесть, что зачастую подобные генераторы платные)

В сети достаточно сервисов для генерации карты сайта, однако у них есть некоторые ограничения:

  • обычно в подобных сервисах бесплатно можно сгенерировать не более 500 страниц
  • для больших сайтов (от 5000 страниц) генерация может занять продолжительное время
  • генерация сайтмап для крупных порталов может и вовсе произойти с ошибкой из-за нехватки ресурсов сервера, на котором расположен данный сервис

Пример онлайн-генератора MySitemapGenerator.com:

Примечание: Недостаток данного метода состоит в том, что при каждом обновлении сайта необходимо вручную генерировать сайтмап и заливать на сервер.

2. Автоматическая генерация Sitemap.xml средствами CMS (например в Bitrix, WordPress, Opencart и прочих системах управления сайтом доступна такая функция)

Наиболее приоритетный вариант, который позволяет настроить частоту обновления Sitemap средствами системы управления сайтом и избавляет вебмастера от ручного размещений сайтмап на сайте.

Пример модуля генерации Sitemap.xml для CMS Opencart:

3. Генерация карты сайта при помощи программы для ПК

Данный вариант подойдет для сайтов небольших и средних размеров, контент на которых обновляется периодически.

Недостатки подобного метода:

  • после генерации сайтмап необходимо заливать его на сервер вручную
  • большинство подобных программ-краулеров для ПК платные

Пример генерации Sitemap.xml при помощи бесплатной программы SiteAnalyzer:

  • скачиваем дистрибутив программы
  • после запуска программы вводим URL сайта и запускаем сканирование
  • после сканирования в главном меню выбираем пункт Проекты -> Генерировать Sitemap

  • в результате получаем карту сайта (одним файлом либо из нескольких файлов, если число страниц превышает 50 000)

  • заливаем сайтмап в корень вашего сайта по FTP протоколу

4. Ручное создание сайтмап

Ручное создание возможно для сайтов с числом страниц до 10, однако для ускорения процесса проще воспользоваться любым онлайн-генератором либо программой для ПК.

Резюмируя все вышеописанное можно выделить основные моменты, на которые нужно обратить внимание при генерации карты сайта:

  • для ресурсов с часто обновляемым контентом карта сайта должна генерироваться на стороне сервера
  • sitemap.xml должен содержать только актуальные страницы сайта, отдающие код ответа сервера 200 и разрешенные к индексации
  • для качественной индексации ресурса карта сайта должна обновляться каждый раз при обновлении контента на сайте

На этом все!
Благодарю за внимание и до новых встреч! 🙂

Полезное

Сервисы для проверки корректности карты сайта:

  • Яндекс Вебмастер: https://webmaster.yandex.ru/tools/sitemap/
  • Google Вебмастер: https://www. google.com/webmasters/ (Ваш сайт -> Сканирование -> Файлы Sitemap -> Добавление/проверка файла Sitemap)

Ссылки на описание Sitemap:

  • Справка Яндекса: https://yandex.ru/support/webmaster/controlling-robot/sitemap.html
  • Справка Google: https://support.google.com/webmasters/answer/183668
  • Описание протокола на русском: https://www.sitemaps.org/ru/protocol.html

Оцените статью

4.7/5

9

Другие статьи:

  • 18 этапов проверки сайта перед покупкой
  • Актуальные способы продвижения сайтов ссылками в 2018 году
  • Быстрый тест скорости загрузки страниц сайта

0 комментариев

Чтобы оставить комментарий необходимо авторизоваться.


<< Назад

что такое карта сайта в XML-формате

Оглавление

  1. org/ListItem»> Для чего используется карта сайта
  2. Виды карт сайта
  3. Что входит в sitemap.xml
  4. Как формируется sitemap.xml больших сайтов
  5. Способы создания карт сайта
  6. org/ListItem»> Что делать после создания карты
  7. О чём стоит помнить

XML-карта сайта

sitemap.xml

Sitemap.xml — это так называемая карта сайта, файл, который содержит в себе ссылки на все важные страницы ресурса. Ближайший его аналог — книжное оглавление: карта позволяет легко ориентироваться по структуре. Сайтмап в несколько раз увеличивает скорость индексации страниц поисковыми системами. Поэтому карта в XML или одном из других форматов — обязательное условие успешного поискового продвижения. В SEO генерация sitemap.xml — одно из базовых действий в самом начале работ.

Для чего используется карта сайта

Работа поисковиков. Чтобы понять, зачем нужен сайтмап, надо знать, как работают поисковые роботы. Они обходят интернет-ресурсы, анализируют информацию на них и заносят в базу, чтобы впоследствии поисковик мог легко выдать ответ на любой запрос, сверившись с этой базой. Это называется индексация. Если содержимое сайта меняется или появляется новая страница, поисковая система узнаёт об этом не сразу, а только после того, как робот обойдёт ресурс заново.

Как помогает sitemap. Робот обходит сайт последовательно, начиная с главной страницы, переходя от одного уровня вложенности к другому. Чем глубже в структуре сайта находится страница, тем больше времени займёт её индексация. А если вложенность большая, есть вероятность, что поисковая программа не доберётся до странички месяцами. Чтобы сориентировать робота, создаётся карта сайта XML: она содержит информацию обо всех важных страницах и не заставляет его тратить лишнее время. В результате программа быстрее индексирует все страницы, не расходуя ресурсы на переходы вглубь сайта. Впрочем, карты тоже бывают разные: некоторые рассчитаны скорее на людей, другие — на программы поисковиков.

Виды карт сайта

Чтобы не допустить путаницы, нужно сразу отделить одно от другого. Файл, служащий «оглавлением» для пользователей, и файл, который использует робот для индексации, — это разные карты. Они различаются форматом, структурой, особенностями размещения, и оптимальный вариант — иметь на своём сайте обе.

HTML. HTML-сайтмап — это обычно ещё одна страница, которая, по сути, представляет собой содержание остальных. Её видно пользователям: обычно ссылка на карту находится на главной странице или в основном разделе. На страничке список URL на все основные разделы и подразделы, структура обычно древовидная, чтобы человеку было легче ориентироваться.

  • Для этого вида карты существуют ограничения по количеству ссылок. Большое количество URL, пусть даже внутренних, понижает страничку, а вместе с ней и весь сайт в поисковой выдаче. Поэтому не рекомендуется указывать в карте более ста линков. Если сайт большой, HTML-сайтмапов может быть несколько. Некоторые используют для лучшего отображения карты JavaScript-код или стили CSS.
  • Цель HTML-страницы — помочь пользователям, поисковые роботы её практически никак не воспринимают. Поэтому её делают в первую очередь наглядной и понятной человеку.

XML. В отличие от предыдущего этот вид используется поисковыми роботами. Карта sitemap.xml — это файл с соответствующим расширением, который располагается в корне сайта. Он составляется по определённому шаблону и содержит в себе до 50 000 ссылок, ведущих на разные страницы ресурса.

  • В содержимое файла входят не только сами URL, но и их приоритет и желаемая частота переиндексации. Конечно, этот показатель довольно условный: если указать нереалистичные сроки, робот не будет их соблюдать. Но помочь более часто индексировать релевантные страницы и подолгу игнорировать те, что обновляются редко, может.
  • Название sitemap.xml и формат отображения информации стандартные, их распознают все популярные поисковые системы. Синтаксис содержимого строится по определённым правилам: стандартизация — обязательное условие для файла, с которым работают машины.

TXT. Этот тип встречается нечасто, в основном на небольших сайтах. Это карта, созданная не в формате XML, а в текстовом формате TXT, то есть в виде обычного текстового документа. Сложной структуры и собственного синтаксиса у такого сайтмапа нет, он не даёт возможности указать приоритет страницы и частоту обхода. Sitemap.txt — это просто построчный список URL всех страничек ресурса без какой-либо дополнительной информации. Он также может включать до 50 000 ссылок. Его называют картой сайта для ленивых. В большинстве случаев использование такого простого решения не оправдано, лучше использовать предыдущий вариант: у него намного шире возможности.

Что входит в sitemap.xml

Синтаксис карты сайта подразумевает использование XML-синтаксиса: содержимое должно быть описано с его помощью. Принцип написания такой же, как при вёрстке HTML: <имя тега>содержимое</имя тега>. Используемая кодировка — непременно UTF-8, в первой строчке сайтмапа находится указание на это.

Первая строчка карты сайта

Указание на используемую кодировку текстаПервая строчка карты сайта

Дальше следуют обязательные и необязательные элементы синтаксиса, каждый из которых отвечает за отдельный параметр.

Обязательные. Теги, которые должны быть в каждой карте сайта sitemap.xml, включают в себя:

<urlset>. Это основной, так называемый родительский тег. Всё остальное содержимое файла обрамлено им. Внутри содержится строчка, указывающая, что используется пространство имён XML;

Родительский тег

в sitemap.xml» border=»0″ alt=»Так выглядит основной тег и указание на использование пространства имён» />

  • <url>. Один из главных тегов. В него заключают сведения об одной конкретной ссылке, включающие в себя сам линк и информацию о нём. Приоритет, частота обновления — всё, что относится к одной конкретной странице, обрамляется отдельным <url></url>;
  • <loc>. Внутри этого тега содержится сама ссылка на страницу и больше ничего.

Необязательные. В sitemap.xml может находиться больше информации, чем просто список линков. Использовать эту возможность необязательно, но желательно: она помогает проставить приоритеты индексации и оптимизировать обход страниц поисковыми роботами. Для необязательных сведений имеются собственные теги:

  • <lastmod>. В него обрамляется дата последнего изменения странички, что позволяет поисковику сориентироваться, нужно ли обходить её заново;
  • <changefreq>. Внутри тега находятся сведения о том, как часто обновляется страница. Возможные значения: always, hourly, daily, weekly, monthly, yearly, never, то есть постоянно, ежечасно, ежедневно, еженедельно, раз в месяц, раз в год, никогда;
  • <priority>. Указывает на приоритет странички. Внутри содержится число от 0,1 до 1, где 0,1 — очень низкий приоритет, 1 — максимально высокий. Он подсчитывается относительно других страниц, так что выставлять везде одинаковое значение не имеет смысла.

Все эти теги, как и обязательный <loc>, находятся внутри блока <url>.

Пример части карты сайта

Полный блок одной ссылки в sitemap.xml

Как формируется sitemap.xml больших сайтов

Одна карта сайта способна вместить в себя до 50 000 адресов, но у крупных ресурсов страниц может быть намного больше. В таком случае формируется несколько сайтмапов. Основная карта, так называемый файл индекса, содержит только ссылки на остальные: sitemap1, sitemap2 и так далее. Уже в этих файлах находятся линки на страницы и информация о них. Вместо <url> в этом случае используется тег <sitemap>, внутрь которого заключаются теги <loc> со ссылками на дочерние карты. Такой же принцип применяют, если вес sitemap.xml превышает 10 Мб.

Пример файла индекса карт сайта

Основной файл карты сайта вмещает в себя ссылки на остальные

Способы создания карт сайта

Разобравшись, что это такое и как описывается, можно перейти к созданию sitemap. Описывать, как создавать HTML и TXT-карту, смысла нет: в первом случае составление аналогично обычной вёрстке страницы, во втором достаточно выгрузить список URL и сохранить в текстовый файл. Подробно стоит остановиться только на файле карты XML. Составить его можно несколькими способами.

Вручную. Вариант подходит для небольших самописных ресурсов. Для любого более-менее крупного сервиса составлять сайтмап вручную — долгий и неблагодарный труд.

Через CMS. Большинство популярных административных панелей имеет встроенные средства создания sitemap или генерирует её автоматически. Конкретный алгоритм действий зависит от используемой CMS и может сильно отличаться.

С помощью сторонних сервисов. Если в админпанели функции генерации карты нет, можно воспользоваться одной из многочисленных программ. Существуют как онлайн-генераторы, так и программные продукты для скачивания или плагины для CMS. Некоторые сервисы платные или имеют ограничения: например, не могут создавать sitemap, включающий более 500 URL. В них можно настраивать параметры и приоритеты для разных страниц.

Что делать после создания карты

Процесс генерации sitemap обычно несложен и занимает мало времени. Главное — правильно указать приоритеты страниц и частоту их обновления. От этих параметров зависит частота индексации. Но с созданием карты работа не заканчивается:

  • sitemap.xml находится в корне сайта, и поисковые системы обычно находят файл самостоятельно. Но, чтобы ускорить этот процесс, рекомендуется размещать ссылку на карту в вебмастерских панелях Яндекса и Google;
  • альтернативное решение — разместить ссылку на sitemap в файле robots.txt, который сообщает поисковым роботам, какие части сайта индексировать, а какие нет. Это делается в одну строчку с помощью отдельной директивы.

Директива Sitemap в robots.txt

Указание на карту сайта в файле для поисковых роботов

После размещения ссылки в файле robots.txt карта сайта должна автоматически появиться в вебмастерской панели. Если этого не произошло, придётся добавить её вручную.

О чём стоит помнить

Создание карты сайта — процесс несложный, но ответственный. Правильно указанные интервалы, отсутствие лишних URL (ссылок на технические файлы, неканонических или неиндексируемых линков), выставленные приоритеты — всё это помогает продвижению и грамотной индексации в поисковиках. Ошибки же, наоборот, способны ухудшить позиции в выдаче. Будьте внимательны и ответственно подходите к тому, какие ссылки размещать в карте сайта.

Что такое XML Sitemap? Как создать карту сайта (с примерами)

XML-карты сайта — одна из самых непонятных составляющих SEO-уравнения.

Я встречал оптимизаторов, которые не могли объяснить, зачем они нужны, не говоря уже о том, как их настроить «правильно».

Вот в чем загвоздка:

Точно так же, как карта необходима для нахождения пункта назначения по дороге, XML-карта сайта имеет решающее значение для поисковых систем для определения URL-адресов вашего веб-сайта.

Если ваши URL-адреса не будут просканированы, они не будут проиндексированы, и ваши страницы (конечно) не будут ранжироваться без индексации.

Короче говоря, XML-карты сайта играют решающую роль в поисковой оптимизации.

В сегодняшней статье я покажу вам, как создать XML-карту сайта с нуля и шаг за шагом идеально оптимизировать ее для SEO. Я расскажу:

  • Что такое XML-карта сайта
  • XML и карты сайта HTML
  • XML-теги карты сайта (и какие из них следует использовать)
  • Примеры XML-карты сайта
  • Зачем нужна карта сайта XML
  • Как создать XML-карту сайта
  • Шесть рекомендаций по созданию файла sitemap.xml

Без лишних слов, давайте перейдем к делу.

Что такое XML Sitemap? (И почему, черт возьми, это должно вас волновать)

Проще говоря:

XML-карта сайта — это дорожная карта для поисковых систем.

В нем перечислены важные материалы вашего веб-сайта в формате XML, чтобы поисковые системы могли легко находить и индексировать ваш контент и в конечном итоге отображать его на страницах результатов поиска.

Вы должны указать в своей XML-карте сайта любую веб-страницу (или файл), которую вы хотите отображать в поисковых системах.

Почему?

Потому что карта сайта обеспечивает возможность обнаружения вашего контента.

Допустим, у вас есть веб-страницы, на которые нет ссылок ни на вашем сайте, ни в Интернете в целом. Если эти страницы не имеют гиперссылок, указывающих на них, поисковые роботы не смогут их найти.

XML-карта сайта (отправляемая поисковым системам) гарантирует, что поисковые системы смогут найти любые страницы, которые вы хотите включить в поисковую выдачу.

Но это еще не все.

Вы можете использовать XML-карту сайта для предоставления дополнительной информации поисковым системам, например, когда ваш контент последний раз обновлялся и какие страницы имеют более высокий приоритет. Подробнее об этом позже.

XML и HTML карты сайта — в чем разница?

Вы можете добавить на свой сайт два типа карты сайта; карта сайта в формате XML и карта сайта в формате HTML.

  • Карты сайта XML используют расширяемый язык разметки (XML)
  • Карты сайта HTML используют язык гипертекстовой разметки (HTML)

Но помимо кода, который они используют, они также выполняют различные функции:

Карта сайта XML

1 с примером XML-карты сайта:

Как видите, XML-карта сайта неудобна для человека.

Карты сайта в формате XML — это фиды, специально предназначенные для поисковых систем.

Они помогают поисковым системам, таким как Google, понять, какие URL сканировать и какие из них имеют приоритет.

Кроме того, как часто меняются эти URL-адреса и какие новые добавляются на сайт.

Эта информация помогает планировщикам поисковых систем лучше оценивать, когда и как часто следует повторно сканировать конкретный URL-адрес.

Карта сайта в формате HTML

Вот пример карты сайта в формате HTML:

Она сильно отличается от карты сайта в формате XML.

Это потому, что эта веб-страница предназначена как для людей, так и для роботов.

Карта сайта в формате HTML облегчает навигацию по веб-сайту.

С точки зрения поисковой системы, карта сайта в формате HTML является полезным инструментом для обнаружения URL-адресов (при условии, что карта сайта сканируется и ссылки, содержащиеся в карте сайта, переходят).

Но это не единственная их ценность для SEO:

Карты сайта в формате HTML также распределяют PageRank по всему веб-сайту.

Поскольку карты сайта в формате HTML обычно связываются с каждой страницы сайта (через навигационную ссылку в нижнем колонтитуле), они имеют огромное количество PageRank.

Это означает, что они могут передать массу своего входящего PageRank другим страницам веб-сайта через внутренние ссылки.

Есть страница с плохим рейтингом?

Добавьте эту страницу в карту сайта HTML.

Это может быть быстрый и простой способ повысить рейтинг.

Как выглядит карта сайта в формате XML?

Как я уже говорил, карты сайта в формате XML предназначены для поисковых систем, а не для людей.

Они, безусловно, могут показаться запутанными, если вы никогда раньше с ними не сталкивались:

 

<ссылка>
https://seosherpa.com/
2022-01-26T19:12:36+09:00
                Ежедневно
                <приоритет>1

<ссылка>
https://seosherpa.com/services/
<последний мод>2021-11-16T13:21:20+09:00
                Ежедневно
                <приоритет>0,8

 

Однако, если вы знаете, что означает каждый из этих компонентов:

  • Объявление XML
  • Набор URL-адресов
  • URL-адрес
  • Последнее изменение
  • Приоритет
  • Частота изменений XML-карты сайта
8

Давайте разберем каждый из них:

Декларация XML

Проще говоря, объявление XML сообщает поисковым системам, что они читают файл XML.

  

В объявлении XML также указывается версия XML и используемая кодировка символов.

  • Версия должна быть 1.0
  • Кодировка должна быть UTF-8.

Поместите объявление XML в начало файла sitemap.xml.

Набор URL-адресов

Набор URL-адресов представляет собой контейнер для всех URL-адресов в карте сайта.

Он начинается с указания стандарта протокола, который использует sitemap.xml:

  

Вы заметите протокол, упомянутый в пример выше — стандарт 0,9.

Google, Yahoo и Microsoft поддерживают этот стандарт карты сайта — я рекомендую вам его использовать.

Важно отметить, что urlset закрывается внизу документа XML:

  

Этот короткий фрагмент кода сообщает поисковым системам, что набор URL закончился.

URL-адрес

Тег является родительским тегом для каждого URL-адреса в карте сайта XML:

 
https://seosherpa. com/services/
 

Между открывающим и закрывающим необходимо указать расположение URL во вложенном теге  .

Здесь важно указать абсолютный URL-адрес, включая протокол HTTP:// или HTTPS://.

Другими словами, укажите URL точно так, как он будет отображаться в веб-браузере.

С другой стороны, относительные URL-адреса, такие как /services/, не будут распознаваться.

Адрес URL — это единственный атрибут, который ДОЛЖЕН указываться между тегами URL.

Но с учетом сказанного, есть еще три (необязательных) свойства, которые могут быть включены:

Последнее изменение

Тег определяет, когда содержимое этого URL-адреса было изменено в последний раз.

 2022-01-26T19:12:36+09:00 

Допустим, вы обновили сообщение в блоге 10 января 2022 года; атрибут будет читаться как 2022-01-10.

Сообщает поисковым системам, когда содержимое этого URL-адреса было в последний раз изменено, что теоретически влияет на повторное сканирование этой страницы поисковой системой.

Можно также указать время, но это необязательно.

Независимо от того, включаете ли вы только дату или время, обязательно используйте формат «дата-время W3C».

Это единственный формат, распознаваемый для тега в файле sitemap.xml.

Приоритет

Тег указывает приоритет URL-адреса по отношению ко всем другим URL-адресам на веб-сайте.

 0.8 

Другими словами, он позволяет указать поисковым системам, какие URL-адреса должны иметь приоритет при выделении краулингового бюджета для вашего сайта.

Значения приоритета могут быть установлены от 0,0 (наименьший приоритет) до 1,0 (максимальный).

Проблема в том, что Google игнорирует в картах сайта XML, потому что, по словам Гэри Иллиса, «это мешок шума».

мы их игнорируем. По сути, это мешок шума

— Гэри 鯨理/경리 Illyes (@methode) 28 марта 2017 г.

Так что на самом деле вообще нет смысла устанавливать приоритет.

Частота изменений

Принимая во внимание, что тег определяет, когда содержимое этого URL-адреса было изменено в последний раз…

Тег указывает, как часто содержимое скорее всего поменять.

 Ежедневно 

Его цель — дать поисковым системам некоторое представление о том, как часто они могут повторно сканировать URL-адрес.

Частота изменения в xml Sitemap может быть установлена ​​на любое из следующих значений:

  • Всегда
  • часовые
  • Ежедневная
  • Еженедельные
  • ежемесячно
  • год
  • Никогда
9
  • года
  • Никогда
  • 9 9001
  • . changefreq>Еженедельно поисковая система может повторно сканировать этот URL-адрес каждые семь дней.

    Делать это чаще было бы расточительно, поскольку содержимое вряд ли изменится.

    Однако устарела с точки зрения Google:

    URL + дата последнего изменения — это то, что нам важно для веб-поиска.

    — 🐄 John 🐄 (@JohnMu) 17 августа 2017 г.

    Поскольку большинство генераторов карт сайта ужасно сопоставляют тег с фактической частотой изменений, легко понять почему.

    Вы можете опустить атрибут частоты изменений в файле sitemap.xml.

    Примеры XML-карты сайта

    Теперь, когда мы знаем, что такое XML-карта сайта, давайте посмотрим на некоторые примеры sitemap.xml, как они выглядят в реальном мире.

    Вот XML-карта сайта для страниц Gymshark:

    Эту карту сайта можно улучшить, удалив , так как она игнорируется Google, и добавив объявление XML в начало XML-файла карты сайта.

    (Включение XML-декларации рекомендуется для всех карт сайта).

    Вот еще один пример XML-карты сайта, на этот раз от yasisland. ae

    Как и карту сайта Gym Shark, эту карту сайта можно улучшить, добавив объявление XML в начале.

    Кроме того, параметры «Частота изменения» и «Приоритет» могут быть удалены, поскольку в настоящее время они являются излишними.

    Помимо этого, эти XML-карты сайта настроены правильно.

    Итак, на этом этапе вы, вероятно, спрашиваете себя:

    Как выглядит оптимальная XML-карта сайта?

    Примерно так:

     
    
    <ссылка>
    https://seosherpa.com/
    2022-01-26
            
    <ссылка>
    https://seosherpa.com/services/
    2021-11-16
    
     

    Он должен содержать:

    • Объявление XML (версия)
    • Набор URL-адресов
    • URL-адреса
    • Последнее изменение (только дата)

    И это действительно все.

    Зачем мне нужен файл Sitemap в формате XML?

    Как я объяснял ранее, поисковая система находит контент в Интернете, переходя с одной веб-страницы на другую с помощью ботов, которых часто называют «пауками»:

    Когда эти пауки обнаруживают новую страницу по внутренней или внешней ссылке, они добавляют эту страницу в свой индекс.

    А проблема с обходом?

    Поисковые системы не могут таким образом найти весь контент в сети.

    Если веб-страница не связана с другой известной страницей, поисковая система не найдет ее.

    Здесь на помощь приходит XML-карта сайта.

    XML-карты сайта действуют как страховка от сканирования, информируя поисковые системы о том, где найти самые важные страницы на вашем веб-сайте, чтобы облегчить обнаружение и индексацию контента.

    Это очень важно, потому что поисковые системы не могут ранжировать ваш контент без его предварительной индексации.

    Для каких типов веб-сайтов нужна XML-карта сайта?

    Если вы следуете советам Google, XML-карты сайта лучше всего подходят для:

    • крупных веб-сайтов с тысячами страниц
    • веб-сайтов с обширными архивами
    • веб-сайтов с большим количеством мультимедийного контента
    • веб-сайтов с очень небольшим количеством обратных ссылок или без них
  • Но вот в чем дело:

    Все веб-сайты выигрывают от наличия XML-карты сайта.

    Когда вы добавляете XML-карту сайта, роботы поисковых систем могут лучше понять структуру вашего сайта, обнаружить ваш контент и узнать, когда он последний раз обновлялся.

    Даже если у вас одностраничный веб-сайт, включение XML-карты сайта, вероятно, того стоит.

    Какие страницы следует включить в XML-карту сайта?

    Краткий ответ:

    Включите все страницы, которые вы хотите отображать в результатах поиска, в свою XML-карту сайта и оставьте все остальное.

    Другими словами, ваша карта сайта должна включать только полезные страницы. Например:

    • Домашняя страница
    • О странице
    • Страницы продукта
    • Страницы услуг
    • Страница контактов
    • Сообщения блога

    Вообще говоря, вы не должны включать такие страницы, как:

    • Страницы благодарности
    • Страницы тегов
    • вы не хотели бы появляться в результатах поиска.

      Но помните: то, что вы исключили страницу из карты сайта, не означает, что она не будет проиндексирована.

      Если на страницу есть ссылки, указывающие на нее, есть вероятность, что Google (и другие поисковые системы) просканирует, проиндексирует и отобразит эту страницу в результатах поиска.

      Чтобы гарантированно удалить страницу из результатов поиска, исключите ее из карты сайта XML и добавьте к ней тег no-index.

      И это подводит меня к следующему пункту:

      Каждая страница в вашей карте сайта XML должна быть индексируемой.

      Ваша карта сайта никогда не должна содержать страницы, возвращающие следующие коды состояния:

      • 404 – Страница не найдена
      • 301 или 302 – Страница перемещена в другое место .

        И, если по этому URL-адресу нет страницы, она не индексируется.

        Кроме того:

        Каждая страница должна быть доступна для сканеров поисковых систем.

        Короче говоря, robots.txt не блокирует страницу, и там нет директив (таких как мета-роботы, канонические ссылки или теги x-robots), говорящих поисковым системам не индексировать страницу.

        Теперь, когда вы знаете, что входит в XML-карту сайта, давайте обсудим, как ее создать.

        Как создать XML-карту сайта (2 методики)

        Если вы создали свой веб-сайт с помощью системы управления контентом, такой как Shopify или Wix, вам не нужно создавать карту сайта XML, потому что ваша CMS сгенерирует карту сайта для вас.

        XML-карта сайта на этих платформах (и им подобных) автоматически обновляется при добавлении или удалении страниц с сайта.

        Если ваша CMS этого не делает, то обычно есть плагин, который сделает это за вас.

        С другой стороны, если вы не используете CMS, вам нужно будет вручную создать XML-карту сайта.

        Давайте разберем процесс:

        Как создать XML-карту сайта вручную

        Если вы беспокоитесь, что вам придется кодировать XML-карту сайта вручную, не волнуйтесь!

        Этот процесс не выполняется вручную.

        Мы собираемся использовать Screaming Frog, чтобы сделать большую часть работы за вас.

        Первый шаг — установить Screaming Frog SEO Spider.

        Совет — вы можете использовать бесплатную версию, если ваш сайт меньше трехсот страниц.

        После установки перейдите в «Режим», затем в «Паук».

        Затем перетащите URL-адрес домашней страницы в поле с пометкой «Введите URL-адрес для паука».

        Затем нажмите «Пуск». сканировать ваш сайт.

        После завершения сканирования мы настраиваем некоторые параметры:

        Поскольку Google не использует и , я рекомендую исключить эти теги из файла карты сайта.

        Я также предлагаю исключить из вашей XML-карты сайта, если вы создаете XML-карту сайта вручную.

        Почему?

        Потому что перестраивать XML-карту сайта каждый раз, когда вы вносите незначительные изменения на страницу, — настоящая боль.

        Исключение из вашей XML-карты сайта означает, что вам не нужно этого делать.

        Прежде чем извлечь файл карты сайта, вы можете добавлять, редактировать или удалять URL-адреса в зависимости от того, что вы хотите, чтобы поисковые системы сканировали и индексировали.

        Завершив настройку карты сайта, вы можете загрузить ее в корневую папку своего веб-сайта с именем файла sitemap.xml.

        Довольно просто, правда?

        Как создать XML-карту сайта в WordPress

        Это может показаться сюрпризом, но «стандартная» установка WordPress не поставляется с создателем XML-карты сайта.

        Для создания XML-карты сайта в WordPress вам понадобится плагин, например Yoast SEO.

        Вот как добавить Yoast на свой веб-сайт, если он еще не установлен:

        На панели управления WordPress перейдите в «Плагины», а затем «Добавить новый».

        Затем выполните поиск «Yoast SEO».

        Затем нажмите «Установить сейчас» в первом результате, затем «Активировать».

        После установки Yoast перейдите к настройкам Yoast и выберите «SEO», затем «XML Sitemaps», а затем «Общие».

        Вкл. на этой вкладке убедитесь, что функция карты сайта XML включена.

        Если XML-карты сайта включены, вы должны увидеть индекс своей карты сайта по адресу yourdomain. com/sitemap_index.xml.

        К счастью, Yoast автоматически исключает неиндексируемые страницы (например, страницы с метатегом robots «без индекса») из карты сайта. При этом стандартная настройка в большинстве случаев должна подойти.

        Однако при желании вы можете исключить определенные типы сообщений и таксономии для дальнейшей оптимизации вашей карты сайта:

        Для сайта SEO Sherpa я исключил медиафайлы и теги из своей карты сайта, потому что, по крайней мере, в моем случае эти страницы имеют небольшую ценность для конечных пользователей.

        Как создать XML-карту сайта в Wix

        В отличие от WordPress, Wix имеет встроенную функцию XML-карты сайта.

        Проблема в том, что он довольно ограничен.

        Единственный вариант, который у вас есть, это исключить определенные страницы.

        Если вы хотите исключить страницу, перейдите на вкладку настроек «SEO (Google)» для страницы и выключите переключатель «Показывать эту страницу в результатах поиска».

        Добавляет на страницу метатег noindex И исключает ее из XML-карты сайта.

        Одна из проблем с жесткой функциональностью карты сайта Wix заключается в том, что она включает URL-адреса, которые были канонизированы для другой страницы.

        Это, по сути, говорит «оценивать эту страницу» и «не оценивать эту страницу» одновременно, что очень сбивает с толку поисковые системы.

        В результате на страницах результатов поиска может отображаться неправильная версия.

        Если у вас есть веб-сайт Wix, вы можете найти автоматически сгенерированную карту сайта по адресу  yourdomain.com/sitemap.xml.

        Как создать XML-карту сайта в Shopify

        Вам не нужно создавать XML-карту сайта, если ваш сайт создан с помощью Shopify, это делается автоматически.

        К сожалению, персонализация невозможна.

        С Shopify вы даже не можете исключить страницу из своей XML-карты сайта — все включено.

        Единственный способ контролировать то, что отображается в результатах поиска, — это добавить тег noindex непосредственно к файлам . liquid.

        Тем не менее, в Shopify неиндексированные страницы будут отображаться в карте сайта XML, что, как мы указывали ранее, не идеально.

        Найдите свою карту сайта на yourdomain.com/sitemap.xml.

        Как отправить карту сайта в Google

        К настоящему моменту у вас должна быть создана карта сайта.

        Последний (и, возможно, самый важный) шаг — отправить карту сайта в Google.

        Конечно, перед этим вам нужно знать, где находится ваша карта сайта.

        Если вы создали карту сайта вручную или используете Wix или Shopify, то карту сайта можно найти по следующему URL-адресу:

        yourdomain.com/sitemap.xml

        С другой стороны, если вы Если сайт находится на WordPress, и вы использовали Yoast для своего sitemap.xml, то вы найдете индекс карты сайта по этому URL-адресу:

        yourdomain.com/sitemap_index.xml

        Если вы используете какую-либо другую платформу или не можете найти свою карту сайта ни в одном из этих мест, вы можете проверить ее с помощью нашего инструмента оценки SEO:

        Когда вы узнаете, где находится ваша XML-карта сайта, перейдите в Google Search Console. затем «Карты сайта», которые вы найдете в меню «Индекс».

        Затем вставьте URL-адрес вашей карты сайта в поле карты сайта и нажмите «Отправить».

        Ваша карта сайта «должна» быть успешно отправлена:

        На этом все готово!

        7 «Основные» рекомендации по работе с XML-картой сайта

        Давайте закончим подборкой рекомендаций по работе с XML-картой сайта.

        Вы можете применить эти методы, чтобы убедиться, что ваша XML-карта сайта оптимизирована для эффективного сканирования и индексирования.

        Приступаем.

        (1). Используйте динамическую карту сайта, а не статическую карту сайта

        Представьте, что вам нужно вручную обновлять карту сайта XML всякий раз, когда вы вносите изменения на свой веб-сайт?!

        Это именно то, что вам нужно сделать со статической картой сайта.

        К счастью, большинство современных CMS имеют встроенную функцию динамической XML-карты сайта или доступную через плагин.

        Что означает:

        Ваша карта сайта будет автоматически обновляться всякий раз, когда вы добавляете, изменяете или удаляете существующие страницы.

        Ручное вмешательство не требуется.

        Использование динамической карты сайта особенно важно для больших веб-сайтов, где часто добавляются приоритетные страницы.

        Обязательно используйте его.

        (2). Используйте стандартное местоположение и имя карты сайта

        Если вы используете /my_website_sitemap.xml в качестве пути для вашей XML-карты сайта, есть вероятность, что поисковые системы не найдут ее.

        Чтобы вашу карту сайта было легко найти, придерживайтесь стандартных местоположений:

        https://yourdomain.com/sitemap.xml для отдельных карт сайта

        ИЛИ

        https://yourdomain.com/sitemap_index.xml, если у вас есть несколько карт сайта в индексе.

        Это так просто.

        (3). Ссылка на XML-карту сайта в файле robots.txt

        Ваш файл robots.txt посещают роботы поисковых систем, когда они начинают сканирование вашего веб-сайта.

        Они используют robots.txt, чтобы понять, как сканировать сайт.

        Ссылаясь на XML-карту сайта в файле robots. txt, вы гарантируете, что поисковые роботы смогут ее найти.

        Чтобы добавить XML-карту сайта в robots.txt, откройте текстовый файл robots и вставьте в него эту строку:

         Карта сайта: https://www.yourdomain.com/sitemap.xml 

        Вы можете найти файл robots.txt файл в корневом каталоге вашего сервера по пути «/robots.txt».

        Если у вас есть несколько XML-карт сайта, просто перечислите их одну за другой, например:

         Карта сайта: https://www.yourdomain.com/page-sitemap.xml
        Карта сайта: https://www.yourdomain.com/post-sitemap.xml
        Карта сайта: https://www.yourdomain.com/product-sitemap.xml 

        Хотя теоретически вы можете разместить карту сайта в любом месте файла robots.txt, обычно лучше всего размещать ее в конце:

        (4). Исключить неиндексированные страницы из вашей карты сайта

        Роль XML-карты сайта состоит в том, чтобы сообщить поисковым системам, что сканировать и индексировать.

        Это означает, что должны быть включены только предпочитаемые вами страницы, достойные рейтинга.

        Добавление неиндексируемых, неканонических страниц или страниц с переадресацией в вашу карту сайта запутает поисковые системы и может негативно сказаться на вашем краулинговом бюджете.

        (5). Размер карты сайта XML не должен превышать 50 МБ

        По данным Google, размер карты сайта XML не должен превышать 50 МБ или 50 000 URL-адресов.

        Всякий раз, когда вы превышаете ограничение в 50 МБ или 50 000 URL-адресов, вы должны разделить один XML-файл Sitemap на несколько XML-файлов Sitemap.

        Превышение этих ограничений может привести к тому, что Google прекратит сканирование.

        Например, карту сайта можно разделить на «записи» и «страницы».

        А затем сгруппируйте их вместе в файл индекса Sitemap.

        (6). Игнорировать атрибуты Priority и Changefreq

        Как я указывал ранее, Google игнорирует оба этих тега:

        ваша карта сайта, что может привести к проблемам с краулинговым бюджетом и индексацией.

        Я рекомендую вообще не использовать теги или в карте сайта.

        (7). Мониторинг Google Search Console на наличие ошибок карты сайта XML

        Если Google не может просканировать вашу карту сайта XML, он сообщит вам через консоль поиска:

        Ошибки могут быть такими же простыми, как невозможность извлечения URL-адреса карты сайта XML, для отправленных URL-адресов, возвращающих статус 404 коды или без индекса.

        Наиболее частые проблемы:

        (a). Отправленный URL-адрес не найден (404)

        Это означает, что URL-адрес, указанный вами в карте сайта XML, не существует.

        Помните, если вы удаляете страницу со своего сайта, не забудьте удалить ее из карты сайта. Более того, используйте динамическую карту сайта в формате XML, и URL-адрес будет автоматически удален из вашей карты сайта.

        (б). Отправленный URL-адрес с пометкой «noindex»

        Это происходит, когда страница в карте сайта XML имеет метатег «noindex».

        Если вы хотите, чтобы эта страница была проиндексирована, вы должны удалить метатег noindex. Если вы не хотите, чтобы он индексировался, удалите его из карты сайта.

        В любом случае это нужно исправить.

        (с). Отправленный URL-адрес заблокирован robots.txt

        Это происходит, когда страница, содержащаяся в карте сайта XML, заблокирована robots.txt.

        По сути, в вашем файле robots.txt есть директива, предписывающая поисковым системам не сканировать страницу, даже если вы попросили поисковые системы сделать именно это, отправив ее для индексации.

        Если вы действительно хотите, чтобы URL-адрес был проиндексирован, найдите и удалите директиву из файла robots.txt.

        Попробуйте протестировать свою страницу с помощью тестера robots.txt, чтобы выявить виновника.

        Вот и все; семь лучших практик для XML-карт сайта.

        Что вы думаете?

        Теперь я хотел бы услышать от вас:

        Какую технику из сегодняшнего поста вы собираетесь использовать в первую очередь?

        Какие изменения вы собираетесь внести в свою XML-карту сайта в результате прочтения сегодняшнего поста?

        Возможно, вы собираетесь перейти от ручной карты сайта к автоматизированной XML-карте? Или, может быть, вы собираетесь опустить тег ?

        В любом случае, дайте мне знать, оставив комментарий ниже.

        Включите JavaScript для просмотра комментариев с помощью Disqus.

        SEO: Объяснение файлов Sitemap в формате HTML, XML

        Существует два типа файлов Sitemap: HTML и XML. Карты сайта в формате HTML направляют посетителей, в основном. XML-карты сайта направляют роботов поисковых систем, чтобы убедиться, что они находят URL-адреса сайта для индексации. Понимание сильных и слабых сторон каждого из них поможет вам в поисковой оптимизации.

        XML Sitemaps

        XML делает информацию машиночитаемой. Карты сайта XML предоставляют поисковым системам эффективный список URL-адресов на сайте.

        Карты сайта XML — это просто текстовые файлы, помеченные тегами, которые определяют типы данных. URL-адрес XML-карты сайта обычно находится в корне домена, например, www.example.com/sitemap.xml , и доступен для ботов.

        Посмотрите на скриншот ниже. Это карта сайта в формате XML для Tiffany & Co. Она содержит 81 266 строк данных для 4 829 URL-адресов продуктов.

        Карта сайта в формате XML для Tiffany & Co., показывающая данные для двух продуктов. Щелкните изображение, чтобы увеличить его.

        Карта сайта Tiffany содержит четыре типа данных для каждого URL-адреса продукта. Например, для URL https://www.tiffany.com/jewelry/rings/tiffany-diamond-wedding-band-GRP00001/ (бриллиантовое обручальное кольцо) мы видим:

        • lastmod. Когда последний раз обновлялось содержимое URL-адреса.
           2019-03-19 
        • частота смен. Как часто содержимое обычно изменяется.
           ежемесячно
        • приоритет. Присваивает числовое значение от 0 до 1, которое представляет важность этого содержимого. Максимальное значение — 1. Обычно оно зарезервировано для главной страницы и верхних целевых страниц. Установка для каждой страницы значения 1 приведет к тому, что поисковые системы полностью проигнорируют это поле.
           0,4
        • hreflang . Определяет URL-адреса, ориентированные на другие языки. Это необязательный атрибут, который обычно находится на веб-странице, но также может быть включен в карты сайта XML.
            

        Когда бот посещает сайт, он сначала обращается к файлу robots.txt, который представляет собой список инструкций, включая URL-адреса, которые следует сканировать или игнорировать. Файл robots.txt должен ссылаться на вашу XML-карту сайта, которая, в свою очередь, отправляет бота для сканирования списка URL-адресов.

        Карты сайта XML следуют точным правилам разметки. После создания XML-карта сайта создается автоматически, в идеале без вмешательства человека. Однако регулярно проверяйте наличие ошибок, потому что устаревшие, неточные и повторяющиеся URL-адреса появляются с удивительной частотой.

        XML-карты сайта имеют ограничения, в том числе:

        • Без гарантии индексации. Карты сайта XML просто рекомендуют URL-адреса, которые поисковые системы должны сканировать и индексировать. Поисковые системы ясно дают понять, что они не могут индексировать каждую страницу или даже сканировать ее.
        • Права доступа не переданы. В отличие от ссылок HTML, URL-адреса в картах сайта XML не передают полномочия ссылки. Если они обнаружат его только в XML-карте сайта, поисковые системы вряд ли ранжируют URL-адрес.

        HTML-карты сайта

        В отличие от XML, HTML-карты сайта представляют собой отформатированные ссылки, обычно расположенные внизу веб-страницы, чтобы показать читателям, что находится на сайте. Карты сайта в формате HTML, как правило, имеют ограниченную ценность для SEO.

        До появления навигационных ролловеров на основе заголовков, которые обеспечивают посетителям глубокий доступ к сайту, карты сайта в формате HTML были очень полезны. Они предлагали ботам короткие ссылки на страницы, которые передавали авторитет ссылок и, таким образом, повышали рейтинг.

        Сегодня многие файлы Sitemap в формате HTML просто копируют ссылки, уже имеющиеся в верхнем или нижнем колонтитуле. Некоторые сайты, безусловно, все еще используют карты сайта в формате HTML для основной навигации.

        На приведенном ниже снимке экрана Tiffany использует свою карту сайта в формате HTML для ссылок на страницы, которые приносят доход, но недоступны через навигацию в верхнем и нижнем колонтитулах. Это добавляет небольшую видимость этих страниц в органическом поиске.

        В своей карте сайта в формате HTML Tiffany ссылается на ценные страницы, которым не хватает места в шапке сайта.

        Карты сайта в формате HTML могут повысить ценность SEO в ограниченных случаях, в том числе:

        • Навигация по основному сайту не связана со всеми страницами.
        • Навигация или раздел сайта недоступны для поисковых систем.
        • Страницы в HTML-карте сайта важны, но в противном случае они были бы глубоко скрыты в структуре навигации. Примеры включают отдельные страницы часто задаваемых вопросов, страницы поддержки, страницы праздников или событий и статьи.
        • Данные Analytics показывают, что посетители используют карту сайта в формате HTML. (Если да, выясните, что заставляет их обходить основную навигацию сайта.)

        Карта сайта в формате HTML не повредит SEO. Это еще одна форма полезных внутренних ссылок. Но остерегайтесь придавать слишком большой приоритет карте сайта в формате HTML. Если вы хотите, чтобы страница привлекала естественный поисковый трафик и конверсии, сделайте ссылку на нее в основной навигации сайта.

        Водитель трафика?

        Короче говоря, карты сайта HTML и XML служат своим целям. Но ни то, ни другое не приведет ваш органический поисковый трафик к новым высотам. Для этого оптимизируйте навигацию. В этом помогут посетители — и поисковые боты.

  • Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *