подробное описание формата, примеры создания XML карты сайта
Комментарии: 0
2053916.10.2018 | Время чтения: 12 минут
Автор: Симагин Андрей
Многие из вас слышали про необходимость наличия у сайта карты Sitemap (он же «сайтмап»), однако не все до конца понимают важность его присутствия на сайте. В данной статье мы проведем обзор файла формата Sitemap.xml, а также опишем варианты его генерации для различных типов сайтов.
Структура статьи:
- Для чего нужна карта сайта
- Описание формата Sitemap
- Маскирование символов
- Разбиение Sitemap на части
- Местоположение Sitemap.xml и его индексация
- Использование кириллических адресов
- Вопросы необходимости карты сайта
- Обзор вариантов генерации Sitemap.xml
Для чего нужна карта сайта Sitemap.xml
Карта сайта Sitemap – это файл XML либо текстового формата (TXT), содержащий в себе все URL сайта (ссылки на страницы либо изображения) и предназначенный для сообщения поисковым роботам информации о новых страницах на вашем ресурсе.
Конечно, поисковые системы проиндексируют ваш сайт и без сайтмапа, и зачастую сделают это не менее качественно, однако в некоторых случаях у поисковиков могут возникнуть сложности с индексацией страниц. Основными причинами неиндексации могут быть такие факторы, как:
- сайт имеет большую вложенность страниц (характерно для крупных веб-ресурсов)
- сайт имеет страницы без навигационных ссылок (на страницы невозможно перейти по внутренней навигации сайта)
- на сайте присутствуют динамические URL
Для подобных страниц из вышеописанных вариантов робот может не добраться никогда, так как в первом случае из-за глубокой вложенности он просто не дойдет до конечного URL, исчерпав краулинговые лимиты сайта, а во втором он физически их не увидит, так как не сможет на них перейти по ссылкам на сайте (например, это может быть вариант, когда ссылка есть, но проставлена при помощи JavaScript, CSS-стилем либо просто зашифрована, из-за чего в исходном коде страницы поисковый робот ее просто не увидит).
Однако, имея информацию о наличии файла Sitemap.xml, поисковый робот будет периодически его обходить и индексировать новые страницы сайта в нужном вам порядке, с необходимым приоритетом и именно по тем страницам, которые вам наиболее важны в данный момент.
Описание формата Sitemap
Sitemap может быть двух типов: текстового формата (TXT) и формата XML.
Текстовый формат представляет собой простой текстовый файл кодировки UTF-8 и содержащий в себе URL сайта в виде наборов строк (каждая ссылка с новой строки). Пример карты сайта текстового формата:
https://www.site.ru/page-1.html https://www.site.ru/page-2.html
Формат XML является расширенным форматом текстового варианта и позволяет передавать поисковым ботам дополнительную информацию. Пример файла Sitemap.xml:
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://www. site.ru/</loc> <lastmod>2018-10-03</lastmod> <changefreq>monthly</changefreq> <priority>1.0</priority> </url> <url> <loc>http://www.site.ru/page-1.html</loc> <lastmod>2018-10-03</lastmod> <changefreq>monthly</changefreq> <priority>0.9</priority> </url> <url> <loc>http://www.site.ru/page-2.html</loc> <lastmod>2018-10-03</lastmod> <changefreq>monthly</changefreq> <priority>0.9</priority> </url> ... <url> <loc>http://www.site.ru/page-N.html</loc> <lastmod>2018-10-03</lastmod> <changefreq>monthly</changefreq> <priority>0.9</priority> </url> </urlset>
Описание элементов XML, на которые необходимо обратить внимание:
- url (обязательный параметр) – содержит все сведения о конкретном URL
- loc (обязательный параметр) – URL страницы. Для URL с параметрами необходимо маскирование
- lastmod – дата и время последнего изменения страницы в формате Datetime. При необходимости допускается опустить сегмент времени и использовать формат ГГГГ-ММ-ДД
- changefreq – указание рекомендательной частоты изменения страницы. Может принимать значения: always, hourly, daily, weekly, monthly, yearly, never
- priority – значимость страницы относительно других URL сайта. Допустимый диапазон значений 0.0 до 1.0. Чем страница важнее, тем приоритет больше. У главной страницы приоритет всегда равен 1, по умолчанию приоритет 0.5
Примечание: стоит упомянуть, что содержимое карты сайта является лишь рекомендацией поисковым роботам по обходу страниц (если установить периодичность обхода страниц раз в неделю, то робот может их обходить гораздо чаще, и наоборот, если установить частоту обхода ежечасно, то это не значит, что поисковики будут индексировать страницу каждый час).
Прочие форматы XML карты сайта:
- Файл Sitemap для изображений
- Отдельный сайтмап для изображений будет полезен, если изображения не доступны боту напрямую (например, если они загружаются с помощью JavaScript). Однако, зачастую, для этого можно использовать обычный Sitemap.xml и указывать в нем ссылки на изображения вместе с обычными URL. Подробнее о сайтмап для изображений в справке Google
- Файл Sitemap для новостей
- Используется для быстрой индексации новостных материалов вашего сайта, при этом ваш ресурс должен быть включен в каталог Google Новости. Требования к Sitemap: должен содержать не более 1000 URL, должен содержать URL новостей, опубликованных за последние два дня. Подробнее о сайтмап для новостей в справке Google
Маскирование
Маскирование в Sitemap.xml используется для URL-адресов и предназначено для интерпретации обычных символов в их псевдокоды в формате HTML:
- Амперсанд: & -> &
- Одинарные кавычки: ‘ -> '
- Двойные кавычки: » -> "
- Больше: > -> >
- Меньше: < -> <
Таким образом, всем привычный URL с параметрами и не маскированными спецсимволами по стандартам XML будет невалиден, пример:
Стандартный URL страницы (не валидный)
https://www. site.ru/index.php?page=news&date=22071981
Валидный URL в Sitemap с маскированием (символ «&» заменен на «&»)
<loc>https://www.site.ru/index.php?page=news&date=22071981</loc>
Для символов в URL, отличных от ASCI, помимо & также необходимо применять маскирование. Пример для URL-адреса:
http://www.site.ru/контакты.html
Тот же URL-адрес с использованием маскирования, для размещения в Sitemap:
http://www.site.ru/%D0%BA%D0%BE%D0%BD%D1%82%D0%B0%D0%BA%D1%82%D1%8B.html
Разбиение Sitemap на составные части
У файла Sitemap.xml есть ограничение как на объем содержащихся в нем URL, так и на сам размер файла. В каждом файле Sitemap.xml должно содержаться не более 50 000 URL, а его объем не должен превышать 50 Мб для Google и 10 Мб для Яндекса (при необходимости файл можно сжать в формат «gzip», но, тем не менее, в распакованном виде он также не должен превышать размер в 50 мегабайт), поэтому при необходимости указания более 50 000 URL-адресов, следует создать несколько файлов Sitemap.
Таким образом, за счет возможности разбиения Sitemap на части, можно обойти все эти ограничения и спокойно генерировать Sitemap для десятков и сотен тысяч страниц.
Разбиение происходит путем создания основного индексного файла Sitemap.xml, содержащего ссылки на дочерние файлы, которые в свою очередь являются стандартными файлами Sitemap.xml и содержат список конечных URL вашего сайта. В основном индексном файле для указания ссылок на дочерние сайтмап используется все тот же тег <loc>, обрамленный тегом <sitemap>, и содержащий ссылки на дочерние Sitemap.xml (названия дочерних сайтмап можно указывать произвольно).
Пример индексного файла XML Sitemap:
<?xml version="1.0" encoding="UTF-8"?> <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <sitemap> <loc>http://www.site.ru/sitemap-1.xml</loc> <lastmod>2018-09-25T21:38:17+00:00</lastmod> </sitemap> <sitemap> <loc>http://www. site.ru/sitemap-2.xml</loc> <lastmod>2018-09-21</lastmod> </sitemap> </sitemapindex>
Формат дочерних файлов карт сайта XML-формата аналогичен стандартным Sitemap.xml.
Местоположение Sitemap.xml и его индексация
Стандартным вариантом размещения сайтмап является корень сайта, пример:
https://www.site.ru/sitemap.xml
При размещении «sitemap.xml» необходимо учитывать тот факт, что набор URL-адресов, которые можно включить в Sitemap определяется именно расположением на сайте, то есть при размещении карты сайта по адресу http://site.ru/news/sitemap.xml она может включать только URL-адреса, начинающиеся с http://site.ru/news/, но не должен включать адреса, начинающиеся с http://site.ru/pages/. Примеры допустимых URL для http://site.ru/news/sitemap.xml:
http://site.ru/news/25092018/ http://site.ru/news/news-all/
К недопустимым URL-адресам в файле http://site.ru/news/sitemap.xml относятся:
http://site. ru/pages/page-1/ http://site.ru/images/1x1.gif http://site.ru/contacts/
Таким образом, во избежание проблем с некорректной индексацией, настоятельно рекомендуется размещать Sitemap.xml в корне сайта.
Индексация Sitemap
Поисковые роботы по умолчанию сканируют корневую директорию сайта, поэтому со временем они найдут ваш сайтмап и перейдут по всем его ссылкам.
Однако, для ускорения посещения файла Sitemap поисковыми ботами необходимо выполнить несколько шагов:
- разместить ссылку на карту сайта в файле «robots.txt»
- добавить ссылку на «sitemap.xml» в панели вебмастера Яндекс и Google
Ссылка на сайтмап в «robots.txt»
User-agent: * ... Sitemap: https://site.ru/sitemap.xml
Добавление сайтмап в панели вебмастера Яндекс и Google
Использование кириллических адресов
Для корректной интерпретации URL различными поисковыми системами рекомендуется все кириллические URL кодировать в формат Punycode (бесплатный конвертер) и использовать маскирование для кириллических адресов страниц.
То есть, вместо адреса:
http://www.ёэлектроника.рф/каталог/лампы/
Необходимо использовать кодированный URL:
http://www.xn--80ajjhbcqhrt1jzb.xn--p1a/%D0%BA%D0%B0%D1%82%D0%B0%D0%BB%D0%BE%D0%B3/
Вопрос необходимости карты сайта
Бесспорно, что присутствие карты сайта желательно на любом сайте. Но, с одной стороны, в сайтмапе нет острой необходимости, так как со временем поисковый робот перейдет на ваш сайт и по ссылкам просканирует все доступные ему страницы. С другой стороны, для сайтов, у которых контент обновляется часто и которым важен порядок и приоритет обхода страниц (СМИ, новостные агентства, etc.), данный файл будет жизненно необходим, так как с помощью него они смогут указать поисковым роботам какие страницы индексировать в первую очередь, а какие после.
Поэтому, возникает справедливый вопрос: а так ли необходим Sitemap.xml конкретно для вашего сайта? Давайте разбираться.
Безусловно, данный файл будет актуален для сайтов объемом от 1000 страниц, а также для тех сайтов, объем страниц которых растет быстро и контент на которых нуждается в частой переиндексации, поэтому за счет данного файла поисковая система будет иметь под рукой всегда актуальный список страниц вашего сайта и с помощью него же будет своевременно индексировать все изменения. Таким образом, актуален данный файл для сайтов, контент на которых меняется часто и большими объемами (добавилось 50 страниц, удалилось 40, обновилось 175 и т.д.):
- СМИ, новостные порталы
- интернет-порталы
- каталоги товаров, агрегаторы
- интернет магазины
- форумы, отзовики, сайты вопросов-ответов
Для подобных сайтов данный файл необходимо иметь в первую очередь, так как от него зависит актуальность представляемой информации в выдаче поисковых систем.
Пример индексации через сайтмап при добавлении на сайт большого числа страниц:
Примечание: файлы Sitemap в таком случае необходимо генерировать на стороне сервера. Генерация карты сайта онлайн при помощи сервисов либо программ для ПК бессмысленна за счет низкой скорости и трудоемкости работ по выкладыванию данных файл на сервер (для крупных порталов, каталогов и интернет-магазинов подобные файлы должны обновляться чуть ли не каждый час (например, обновление цен в интернет-магазине)).
Вторая категория сайтов, для которых также необходим данный файл – это сайты от 100 до 1000 страниц и представляющие услуги бизнеса, а также просто информационные странички:
- сайты по продаже товаров и услуг
- сайты компаний и представительств
- блоги
На подобных сайтах обычно приток новых страниц происходит плавно, удаление страниц и разделов случается еще реже. Поэтому само собой подобные сайты должны иметь файлы Sitemap XML, однако в данном случае данный файл больше важен для первичной индексации сайта (чтобы за один обход файла поисковый робот узнал про все страницы сайта и оперативно их проиндексировал). Далее, новые страницы в виду их единичного добавления можно отсылать на переиндексацию даже через панель вебмастера Яндекса или Google и таким образом поддерживать актуальность страниц для поисковых систем. Файлы Sitemap для подобного рода сайтов можно генерировать специальными программами и сервисами, о которых будет написано ниже.
Третья категория сайтов – сайты с числом страниц до 100. К ним относятся:
- лендинги (одностраничные сайты для продажи конкретного товара либо услуги)
- промо-сайты (например, сайты коттеджных поселков)
- сайты-визитки
- домашние странички
Все эти сайты зачастую содержат небольшое число страниц о какой-то одной услуге, товаре, событии. Для подобного рода сайтов в наличии Sitemap нет какой-то жизненно важной необходимости. Так как контент на них обновляется достаточно редко и новые страницы добавляются с низкой интенсивностью, поисковые роботы такие сайты обходят не часто в виду малого числа страниц на них, поэтому для данных сайтов вполне подойдет как использование Sitemap.xml, так и его предшественника HTML карты сайта – это обычная HTML-страница стилизованная под дизайн сайта, на которой размещены все ссылки на внутренние страницы сайта в иерархическом виде (обычно в виде дерева). Таким образом, поисковый робот, посетив эту страницу, может обойти все страницы сайта и проиндексировать их либо обновить о них информацию. Пример такой страницы:
Примечание: на текущий момент создание подобных страниц перестало быть актуальным в виду перехода на формат XML, который не нужно создавать руками, а можно сгенерировать специальными программами либо сервисами (их примеры представлены ниже).
Таким образом, из всех вышеизложенных заключений можно сделать простой вывод, что чем больше объем страниц вашего сайта и чем чаще он обновляется, тем острее необходимость наличия на нем карты сайта Sitemap.xml, который в идеале должен генерироваться на сервере автоматически, без участия человека.
Важно!
Сайтмап должен включать в себя только актуальные страницы сайта необходимые для индексации и отдающие код ответа сервера 200. Все прочие служебные, технические либо страницы, запрещенные к индексации, не должны присутствовать в карте сайта.
Варианты генерации Sitemap.xml
Существует несколько методов генерации, перечислим их:
1. Генерация карты сайта при помощи онлайн-генератора (стоит учесть, что зачастую подобные генераторы платные)
В сети достаточно сервисов для генерации карты сайта, однако у них есть некоторые ограничения:
- обычно в подобных сервисах бесплатно можно сгенерировать не более 500 страниц
- для больших сайтов (от 5000 страниц) генерация может занять продолжительное время
- генерация сайтмап для крупных порталов может и вовсе произойти с ошибкой из-за нехватки ресурсов сервера, на котором расположен данный сервис
Пример онлайн-генератора MySitemapGenerator.com:
Примечание: Недостаток данного метода состоит в том, что при каждом обновлении сайта необходимо вручную генерировать сайтмап и заливать на сервер.
2. Автоматическая генерация Sitemap.xml средствами CMS (например в Bitrix, WordPress, Opencart и прочих системах управления сайтом доступна такая функция)
Наиболее приоритетный вариант, который позволяет настроить частоту обновления Sitemap средствами системы управления сайтом и избавляет вебмастера от ручного размещений сайтмап на сайте.
Пример модуля генерации Sitemap.xml для CMS Opencart:
3. Генерация карты сайта при помощи программы для ПК
Данный вариант подойдет для сайтов небольших и средних размеров, контент на которых обновляется периодически.
Недостатки подобного метода:
- после генерации сайтмап необходимо заливать его на сервер вручную
- большинство подобных программ-краулеров для ПК платные
Пример генерации Sitemap.xml при помощи бесплатной программы SiteAnalyzer:
- скачиваем дистрибутив программы
- после запуска программы вводим URL сайта и запускаем сканирование
- после сканирования в главном меню выбираем пункт Проекты -> Генерировать Sitemap
- в результате получаем карту сайта (одним файлом либо из нескольких файлов, если число страниц превышает 50 000)
- заливаем сайтмап в корень вашего сайта по FTP протоколу
4. Ручное создание сайтмап
Ручное создание возможно для сайтов с числом страниц до 10, однако для ускорения процесса проще воспользоваться любым онлайн-генератором либо программой для ПК.
Резюмируя все вышеописанное можно выделить основные моменты, на которые нужно обратить внимание при генерации карты сайта:
- для ресурсов с часто обновляемым контентом карта сайта должна генерироваться на стороне сервера
- sitemap.xml должен содержать только актуальные страницы сайта, отдающие код ответа сервера 200 и разрешенные к индексации
- для качественной индексации ресурса карта сайта должна обновляться каждый раз при обновлении контента на сайте
На этом все!
Благодарю за внимание и до новых встреч! 🙂
Полезное
Сервисы для проверки корректности карты сайта:
- Яндекс Вебмастер: https://webmaster.yandex.ru/tools/sitemap/
- Google Вебмастер: https://www. google.com/webmasters/ (Ваш сайт -> Сканирование -> Файлы Sitemap -> Добавление/проверка файла Sitemap)
Ссылки на описание Sitemap:
- Справка Яндекса: https://yandex.ru/support/webmaster/controlling-robot/sitemap.html
- Справка Google: https://support.google.com/webmasters/answer/183668
- Описание протокола на русском: https://www.sitemaps.org/ru/protocol.html
4.6/5
10Другие статьи:
- 18 этапов проверки сайта перед покупкой
- Актуальные способы продвижения сайтов ссылками в 2018 году
- Быстрый тест скорости загрузки страниц сайта
0 комментариев
Чтобы оставить комментарий необходимо авторизоваться.
<< Назад
Карта сайта XML
Главная / Редактирование сайта / Как мне настроить сайт? / Настройки SEO / Карта сайта XML
youtube.com/embed/R3fbSbrPOcA» frameborder=»0″ allow=»accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture» allowfullscreen=»»>Что такое sitemap.xml
Sitemap.xml – это файл в формате xml, который выполняет функцию карты сайта для поисковых систем.
Файл Sitemap.xml содержит URL-адреса страниц сайта, а также относящиеся к ним данные, такие как: время их последнего обновления, частоту их обновления и важность относительно других страниц сайта. Вся эта информация способствует быстрой и эффективной индексации страниц сайта поисковыми системами.
Подключение файла sitemap.xml особенно рекомендуется для сайтов с большим количеством страниц (более 100).
Данная карта необходима для поисковых систем — она позволяет вашему сайту лучше анализироваться поисковыми ботами, повышает шансы на улучшение позиций сайта в поисковой выдаче.
Подключение
Зайдите в систему управления сайтом. Раскройте меню «Настройки» и выберите «Карты сайта XML».
Шаг 2
Откроется страница «Карты сайта XML».
В ней отображается текущее состояние файла (Подключено, Отключено).
Шаг 3
Для подключения карты сайта XML нажмите на ссылку «Подключить». Карта сайта сгенерируется в течение суток (до этого будет отображаться надпись “»Карты сайта XML еще не генерировались»).
Шаг 4
После того как карта сайта будет сгенерирована:
- Под статусом «(подключено) Отключить» отображается строка со ссылкой на сгенерированную карту, датой последнего обновления, размером файла и кнопой «Загрузить».
- С помощью ссылки «Загрузить» можно загрузить данный файл на компьютер или открыть его в окне браузера.
- С помощью ссылки «Добавить» можно загрузить вместо автоматически сгенерированного файла карты сайта свой, созданный самостоятельно. Обратите внимание! Данная ссылка доступна только при наличии расширенных прав доступа.
Ниже всей информации присутствуют ссылки справки, пройдя по которым, можно посмотреть информацию влияния карты сайта на индексацию поисковых систем сайта.
Карта сайта для иллюстраций
В случае если в «Системных настройках» вы включили генерацию отдельной карты сайта для картинок, тут будет выводиться также и ссылка на отдельный файл с информацией об используемых на сайте иллюстрациях.
Обратите внимание!
- Загруженная вручную карта будет обладать большим приоритетом по сравнению с автоматически генерируемой.
- Загруженная вручную карта будет использоваться вне зависимости от того, включена ли автоматическая генерация.
- При удалении загруженной вручную карты на сайте вместо нее будет использоваться автоматически сгенерированная (если ее генерация включена).
- Допустима загрузка только файлов в формате XML.
- В карту сайта не попадают страницы, закрытые для индексации.
Была ли статья вам полезна?
Да
Нет
Укажите, пожалуйста, почему?
- Рекомендации не помогли
- Нет ответа на мой вопрос
- Содержание статьи не соответствует заголовку
- Другая причина
Комментарий
Читайте также
Как найти карту сайта на любом веб-сайте
Чтобы найти карту сайта для своего веб-сайта, достаточно поискать ее в нужных местах. Если он существует, эти шаги помогут вам найти его в 99% случаев.
Обратите внимание, что в этой статье мы говорим о XML-карте сайта.
Что такое карта сайта в формате XML?
XML Sitemap — это список URL-адресов вашего веб-сайта, предоставленный поисковым системам. Он написан в формате кода, описанном sitemaps.org, который является авторитетом в области XML-карт сайта.
Как выглядит наша карта сайта WriteMaps XML…
Зачем мне нужно находить карту сайта?
Вам потребуется найти XML-карту сайта для своего веб-сайта, чтобы убедиться, что она у вас есть, убедиться, что она действительна, а затем отправить URL-адрес поисковым системам.
Лучше всего поместить файл карты сайта в корневую папку домена.
напр. https://writemaps.com/sitemap.xml
Но его можно хранить где угодно, даже на другом домене!
Наличие карты сайта не является обязательным, но помогает поисковым системам быстрее находить и индексировать новые веб-сайты или обновленные веб-страницы.
Как найти карту сайта
Первые три основных места, где можно найти карту сайта:
- Попробуйте ввести имя своего домена, например. https://writemaps.com со следующими окончаниями
/sitemap
/sitemap.xml
/sitemap_index.xml
- Попробуйте ввести имя домена, например. https://writemaps.com плюс /robots.txt
например. https://writemaps.com/robots.txt
Совет: замените «writemaps.com» своим доменным именем
Найдите в файле robots.txt URL-адрес карты сайта, так как это стандартная практика, поскольку это первое место, которое ищут поисковые системы. - Выполните поиск по сайту в Google, введя свой сайт и выполнив поиск файла типа XML в поисковой системе.
напр. "сайт:writemaps.com тип файла:xml"
Если вы получите много результатов этого поиска, вы можете уточнить поиск. Попробуйте добавить критерий наличия «карты сайта» в URL-адресе
напр. "site:writemaps.com тип файла:xml inurl:sitemap"
Расширенный — как найти карту сайта
Если ни один из основных способов не сработал, попробуйте поискать карту сайта с помощью службы веб-сканирования.
Быстрый и простой способ — инструмент карты сайта SEO Site Checkup — просто введите свой URL-адрес и дайте им посмотреть, смогут ли они найти вашу карту сайта.
Во-вторых, вы можете попробовать создать бесплатную учетную запись на Spotibo и просканировать свой сайт. Затем вам нужно будет просмотреть только типы файлов XML, чтобы увидеть, есть ли у вас карта сайта.
Как найти карту сайта в Shopify и Squarespace
Shopify и Squarespace автоматически генерируют карты сайта в формате XML. И обе платформы помещают их в файл sitemap.xml в корневой папке вашего домена. Поэтому попробуйте ввести это прямо в браузере:
https://yourwebsite.com/sitemap.xml
Совет: замените «yourwebsite.com» на ваше доменное имя
Этот файл карты сайта часто может действовать как индексная страница карты сайта. и ссылку на дополнительные карты сайта, которые вместе взятые перечисляют URL-адреса вашего веб-сайта.
Как и любая хорошая платформа или плагин, эти карты сайта автоматически обновляются в течение 24 часов, когда вы добавляете новые страницы или контент. Невозможно напрямую редактировать карту сайта.
При настройке Google Search Console вам может потребоваться подтвердить право собственности на свой сайт, прежде чем вы сможете отправить карту сайта.
В Shopify вам нужно будет следовать их пошаговому руководству, чтобы добавить метатег google-site-verification на свой веб-сайт.
Squarespace предлагает немного другие методы проверки вашего сайта с помощью консоли поиска Google, чтобы вы могли отправить свою карту сайта.
Как найти карту сайта в WordPress
WordPress не создает карты сайта XML автоматически, и эта работа обычно выполняется плагином.
Если вы настраиваете свой веб-сайт впервые, скорее всего, у вас не будет карты сайта.
Добавьте плагин, такой как Google XML Sitemaps, для простого инструмента, работающего только с картой сайта. Или попробуйте Yoast SEO, который также легко создает XML-карту сайта, но также предоставляет множество других инструментов SEO.
Если кто-то еще участвовал в создании вашего веб-сайта, возможно, у вас уже есть работающий плагин карты сайта.
Большинство подключаемых модулей размещают вашу карту сайта либо в /sitemap, либо в /sitemap.xml, либо в /sitemap_index.xml — поэтому постарайтесь сначала поискать там или в файле yourwebsite.com/robots.txt URL-адрес карты сайта.
В противном случае войдите в свою административную область WordPress и просмотрите следующие места:
- «Плагины» — просмотрите свои активные плагины, чтобы увидеть, какие из них могут быть связаны с картой сайта. Если да, то вы сможете прочитать его документацию, чтобы найти, где изменить его настройки.
- «Инструменты» или «Настройки» — и вы ищете что-то вроде «Карта сайта» или «Карта сайта XML»
- «SEO» > «XML Sitemaps» — если у вас уже есть плагин Yoast SEO (что очень распространено), то здесь вы должны убедиться, что автоматическое создание XML-карты сайта включено.
Что будет дальше?
Если вы не можете найти карту сайта , вам может потребоваться создать карту сайта.
Если вы нашли свою карту сайта , вам нужно убедиться, что Google знает об этом. Выполните следующие действия, чтобы отправить карту сайта в Google Search Console.
Эти советы помогут вам найти карту сайта и сообщить о ней поисковым системам.
Удачи в дикой природе, дикой, сети…
Как найти карту сайта веб-сайта
Обновлено: 9 июня 2023 г. эти 8 простых способов + один бонусный способ.
Поиск карты сайта веб-сайта — простая задача, с которой может справиться любой оптимизатор. Эта статья покажет вам 8 простых способов найти карту сайта любого веб-сайта.
Я начну с самого популярного формата карты сайта — XML, а затем перейду к другим форматам. Давайте начнем!
Что такое карта сайта сайта?
Зачем нужно находить URL-адрес карты сайта веб-сайта?
Как проверить и найти карты сайта веб-сайта1. Вручную проверьте общие местоположения XML-карты сайта
2. Проверьте, указан ли URL карты сайта в robots.txt.
3. Используйте операторов поиска Google, чтобы найти карту сайта
4. Проверьте, была ли карта сайта в формате XML отправлена в Google Search Console.
5. Проверьте, была ли карта сайта в формате XML отправлена в Инструменты для веб-мастеров Bing.
6. Используйте онлайн-инструмент
7. Проверьте расположение стандартной XML-карты сайта CMS.
8. Букмарклет для поиска URL карты сайта XML
Как найти карту сайта, отличную от XML
Нашли карту сайта? Вот что делать дальше.
Не нашли URL-адрес карты сайта в формате XML? Сделай это.
Часто задаваемые вопросы о XML-картах сайта и картах сайта
Что такое карта сайта веб-сайта?
Карта сайта — это файл, содержащий список всех страниц веб-сайта, которые вы хотите проиндексировать поисковыми системами.
Файлы Sitemap бывают разных форматов, например XML , HTML или TXT , и могут включать дополнительную информацию о каждой странице, например дату последнего изменения или важность этой страницы по сравнению с другими страницами на сайт.
- Наличие карты сайта может помочь поисковым системам быстрее обнаруживать новый контент на вашем сайте и обеспечить сканирование и индексирование всех ваших страниц.
- Это также может помочь вам определить любые ошибки сканирования или страницы, которые могут отсутствовать на вашем сайте.
- Создание карты сайта является важной частью внутренней SEO-оптимизации и может улучшить общую видимость и рейтинг вашего веб-сайта.
Вот пример карты сайта (это карта моего сайта):
Это пример карты сайта.Вот скриншот из примера карты сайта XML, представленной на sitemaps.org:
Как вы, наверное, заметили, в этом примере карты сайта используются устаревшие параметры, такие какА вот скриншот URL индекса карты сайта на моем сайте:
Код XML карты сайта моего сайта.Зачем нужно находить URL-адрес карты сайта веб-сайта?
Может быть несколько причин, по которым вам необходимо найти карту сайта. Наиболее распространенные из них:
- Вы просто хотите узнать, какие страницы, сообщения и категории блогов есть на конкретном веб-сайте.
- Вы являетесь SEO-аудитором и просто хотите проверить карту сайта.
- Вы хотите оценить, действительно ли сайт нуждается в карте сайта. Огромные веб-сайты обычно должны иметь веб-сайт, в то время как небольшие могут обойтись без карты сайта.
Обязательно ознакомьтесь с моей статьей о том, как проводить аудит XML-карты сайта, чтобы глубже погрузиться в аудит XML-карт сайта.
Как проверить и найти карты сайта
И прежде чем мы начнем, обратите внимание, что:
- Наиболее распространенным и стандартным расположением карты сайта является, конечно же, корневой каталог домена.
- Однако это расположение не является ни требованием, ни официальным стандартом. Это означает, что карта сайта может быть размещена в подкаталоге или даже в совершенно другом домене. Некоторые люди делают это, чтобы скрыть свои карты сайта от конкурентов.
- То же самое относится и к имени файла, которое не обязательно должно быть «карта сайта» или содержать слово «карта сайта».
Вот почему я показываю вам здесь все более и менее очевидные места карты сайта веб-сайта. Это все варианты, которые я видел за свой 10-летний опыт работы консультантом по SEO .
Ладно, пора, наконец, приступить к детективной работе.
1. Вручную проверить общие местоположения XML-карты сайта
Это самый очевидный и быстрый способ найти URL-адрес карты сайта веб-сайта. В большинстве случаев это все, что вам нужно сделать, чтобы обнаружить XML-карту сайта веб-сайта.
Наиболее распространенные местоположения для карт сайта:
-
/sitemap.xml
-
/sitemap_index.xml
(индекс карт сайта) -
/sitemap/
(который часто перенаправляет на sitemap.xml)
Конечно, все, что идет перед «/», является доменным именем вашего веб-сайта.
В случае моего веб-сайта (основанного на WordPress) местоположение карты сайта по умолчанию https://seosly.com/sitemap.xml перенаправляет на https://seosly.com/sitemap_index.xml.
XML-карта сайта, созданная Rank Math для моего веб-сайта.Как вы можете видеть, индекс карты сайта имеет следующие две карты сайта:
- https://seosly.com/post-sitemap.xml
- https://seosly.com/page-sitemap.xml
А вот другие возможные имена файлов для карты сайта или индекса карты сайта:
-
/sitemap.php
-
/sitemap.txt
-
/sitemap.xml.gz
(с использованием сжатия gzip) -
/sitemap1.xml
(при наличии нескольких файлов Sitemap это может быть первая карта сайта в группе) -
/post-sitemap.xml
(карта сайта сообщений, как на моем сайте) -
/page-sitemap. xml
(карта сайта страниц, такая же как на моем сайте) -
/sitemap-index.xml
(с «-» вместо «_») -
/sitemapindex.xml
(без разделения) -
/sitemap_index.xml.gz
(с использованием сжатия Gzip) -
/sitemap/index.xml
(в подпапке)
И веб-сайт также может использовать свой канал в качестве карты сайта, и в этом случае карта сайта может быть примерно такой:
-
/rss/
(канал RSS в качестве карты сайта) -
/rss.xml
(канал RSS в виде карты сайта) -
/atom.xml
(канал Atom в качестве карты сайта)
Видишь? Множество возможностей.
2. Проверьте, указан ли URL-адрес карты сайта в robots.txt
Еще один очевидный и быстрый способ определить URL-адрес XML-файла — проверить robots.txt.
Robots.txt — это специальный файл, содержащий директивы для роботов поисковых систем. Здесь также можно разместить ссылку на карту сайта, чтобы поисковым системам было легче обнаружить карту сайта и просканировать веб-сайт.
Чтобы просмотреть файл robots.txt любого веб-сайта, просто добавьте /robots.txt
в домен. В случае с моим сайтом это https://seosly.com/robots.txt.
Вот содержимое файла robots.txt моего веб-сайта с указанием URL-адреса карты сайта:
Последняя строка указывает местоположение карты сайта.
☝️ СОВЕТ ПРОФЕССИОНАЛА: Если сайт имеет нестандартное расположение карты сайта, то в файле robots.txt это должно быть указано.
Если вы хотите узнать больше о файле robots.txt, о том, что это такое, для чего он нужен и как его следует использовать, ознакомьтесь с вводной частью robots.txt в Центре поиска Google.
⚡ Если вы используете WordPress, ознакомьтесь с моим руководством по доступу к robots.txt в WordPress.
3.
Используйте операторы поиска Google, чтобы найти карту сайтаВы также можете найти URL-адрес XML-файла с помощью операторов поиска Google (нажмите, чтобы просмотреть полный список операторов поиска, работающих в настоящее время в Google).
Существует как минимум несколько операторов, которые можно использовать для поиска XML-карты сайта веб-сайта:
-
сайт:
-
тип файла:
илидоб:
-
входящий адрес:
Давайте попробуем найти XML-карту сайта moz.com, используя эти поисковые операторы.
Команда site:moz.com filetype:xml
или site:moz.com ext:xml
будет искать файлы XML в домене moz.com.
Вы также можете немного сузить поиск и попробовать что-то вроде site:moz.com filetype:xml inurl:sitemap
или site:moz.com ext:xml inurl:sitemap
, который будет искать XML-файлы со словом «sitemap» в домене moz. com.
Вы также можете искать файлы Sitemap, которые имеют другой тип файла, чем XML, например текстовые файлы.
Для этого вы можете использовать команду site:moz.com filetype:txt inurl:sitemap
или site:moz.com ext:txt inurl:sitemap
, которая будет искать текстовые файлы, содержащие слово «sitemap ” в домене moz.com
СОВЕТ ПРОФЕССИОНАЛА: Обратите внимание, что этот метод будет работать только в том случае, если XML-карта сайта индексируется (и действительно индексируется Google).
СОВЕТ ПРОФЕССИОНАЛА 2: Многие популярные плагины WordPress, которые автоматически генерируют XML-карты сайта (например, Rank Math), добавляют тег «noindex, follow» в карты сайта.
Если это так, то вы не сможете найти карту сайта с помощью операторов поиска Google.
Вот как XML-карта сайта генерируется на моем веб-сайте. Если бы я хотел найти его с помощью оператора поиска, я бы не смог его найти.
Нет результатов, несмотря на то, что у меня есть карта сайта.
4. Проверьте, была ли карта сайта в формате XML отправлена в Google Search Console
Другим местом для поиска карты сайта является Google Search Console . Этот шаг будет работать, только если у вас есть доступ к учетной записи GSC для веб-сайта. Если он у вас есть, вот что вам нужно сделать:
- Войдите в Google Search Console.
- В разделе Index перейдите к Sitemaps .
- Если карта сайта в формате XML была отправлена в Google, вы увидите ее URL-адрес под Отправленная карта сайта s.
Если вы новичок в Google Search Console или на анализируемом веб-сайте нет учетной записи GSC, обязательно ознакомьтесь с базовым руководством по Google Search Console в Google Search Central.
НАКОНЕЧНИК PRO: Google Search Console — это инструмент, который должен использовать любой веб-сайт, который хочет быть видимым в Google.
👉 Говоря о GSC, вы можете узнать о новом отчете статистики сканирования в Google Search Console . Кроме того, ознакомьтесь с моим руководством по , как добавить нового пользователя в GSC , если вы хотите, чтобы кто-то еще получил доступ к вашим данным GSC.
5. Проверьте, была ли карта сайта в формате XML отправлена в инструменты Bing для веб-мастеров.
Вы также можете найти карту сайта в формате XML в инструментах для веб-мастеров Bing так же, как вы делали это в Google Search Console.
Этот шаг имеет смысл только в том случае, если у веб-сайта есть учетная запись в Bing Webmaster Tools. Вот как проверить, была ли отправлена карта сайта в формате XML:
- Войдите в Bing Webmaster Tools .
- На левой панели выберите Sitemaps .
- Если есть отправленные карты сайта, вы увидите их URL справа под Карта сайта s.
☝️ СОВЕТ ПРО: Здесь также можно отправить XML-карту сайта в Bing.
6. Используйте онлайн-инструмент
Поскольку мы говорим об инструментах, вы также можете использовать онлайн-инструмент, созданный специально для проверки наличия на веб-сайте XML-карты сайта.
URL-адрес инструмента : https://seositecheckup.com/tools/sitemap-test
Вот как проверить, есть ли на веб-сайте XML-карта сайта с помощью инструмента SEO Site Checkup:
- Введите URL-адрес веб-сайта, который вы хотите проверить.
- Нажмите Enter или нажмите Checkup , и вы сможете увидеть URL-адрес карты сайта.
- Вы также можете добавить другие URL-адреса (например, URL-адреса конкурентов) и сравнить результаты.
☝️ СОВЕТ ПРОФЕССИОНАЛА: Обратите внимание, что этот инструмент проверяет возможные стандартные местоположения карты сайта XML и иногда может не обнаружить карту сайта, даже если она есть на веб-сайте.
7. Проверьте расположение стандартной XML-карты сайта CMS
В зависимости от CMS веб-сайта вы сможете найти XML-карты сайта по разным URL-адресам.
Самые популярные системы управления контентом имеют свои собственные XML-карты сайта по умолчанию, которые также стоит проверить.
- Если вы знаете CMS изучаемого веб-сайта, скорее всего, его URL-адрес XML-карты сайта находится в расположении по умолчанию для этой CMS для этого URL-адреса сайта.
- Если вы не знаете CMS, вы можете проверить ее с помощью такого инструмента, как CMS Detect . Все, что вам нужно сделать, это ввести URL-адрес и нажать Detect CMS .
Ниже приведены расположения файлов Sitemap в формате XML по умолчанию для наиболее популярных систем управления контентом и ссылки на документацию.
Расположение URL-адресов карты сайта по умолчанию в WordPress
С июля 2020 года в WordPress 5.5 появилась новая функция XML для карты сайта . Это означает, что вам не нужен какой-либо плагин для создания карты сайта для вашего сайта WordPress.
Если веб-сайт WordPress использует эту функцию, то его карта сайта доступна по адресу /wp-sitemap.xml
.
Если веб-сайт WordPress использует один из плагинов, автоматически генерирующих карту сайта, он доступен по одному из следующих адресов:
-
/sitemap.xml
-
/sitemap_index.xml
-
/post-sitemap.xml
-
/page-sitemap.xml
-
/category-sitemap.xml
-
/tag-sitemap.xml
Вы также можете просто проверить настройки плагина, чтобы увидеть точное местоположение карты сайта.
Большинство автоматически генерируемых карт сайта в WordPress также добавляют запись карты сайта в robots. txt.
Расположение URL-адресов карты сайта по умолчанию в Wix
Wix автоматически позаботится о карте сайта для вас, и ваша единственная задача — отправить ее в Google Search Console. URL-адреса карты сайта по умолчанию для основной карты сайта в Wix также имеют вид /sitemap.xml
.
Другие URL-пути в Wix для разных карт сайта:
-
/pages-sitemap.xml
для страниц -
/blog-pages-sitemap.xml
для нового блога Wix -
/store-products-sitemap.xml
для Wix Stores -
/booking-services-sitemap.xml
для Wix Bookings -
/форум-страницы-sitemap.xml
для форума Wix -
/event-pages-sitemap.xml
для событий Wix -
/member-profile-sitemap.xml
для участников -
/dynamic-pages-sitemap.xml
для данных Wix и страниц маршрутизатора -
/other-pages-sitemap. xml
для других страниц, не принадлежащих ни к одной из вышеуказанных категорий
Вы можете узнать больше о картах сайта в Wix здесь.
Расположение карты сайта по умолчанию в Squarespace
Squarespace, как и Wix, заботится о карте сайта. Местоположение карты сайта по умолчанию для веб-сайтов Squarespace также /sitemap.xml
.
Вы можете узнать больше о картах сайта в Squarespace здесь.
Расположение карты сайта по умолчанию в Shopify
В Shopify карта сайта также имеет стандартное расположение: /sitemap.xml
.
Вы можете узнать больше о картах сайта в Shopify здесь.
Расположение карты сайта по умолчанию в Joomla
Расширения, доступные для Joomla, также автоматически генерируют карту сайта веб-сайта. Стандартное местоположение карты сайта Joomla XML: /sitemap. xml
.
Вы можете узнать больше о картах сайта в Joomla здесь.
Расположение карт сайта по умолчанию в Magento
И, наконец, несколько слов о картах сайта в Magento. Этот также использует стандартное местоположение карты сайта, которое равно /sitemap.xml
, но вы можете изменить его, если хотите.
Вы можете узнать больше о картах сайта в Magento здесь.
8. Букмарклет для поиска URL-адреса XML-карты сайта
Если вы похожи на меня и всегда ищете способы повысить производительность и сэкономить время на SEO-задачах, у меня есть для вас полезный совет.
Существует быстрый и простой букмарклет, который можно использовать для мгновенной проверки XML-карты сайта любого веб-сайта.
Все, что вам нужно сделать, это добавить следующий код JavaScript в свои закладки:
javascript:void(location.href='http://' + location. host + '/sitemap.xml')
После сохранения просто нажмите на букмарклет, и он откроет для вас файл карты сайта. , если он находится в папке по умолчанию /sitemap.xml.
Этот маленький трюк может сэкономить ваше время и упростить проверку карты сайта любого веб-сайта, над которым вы работаете.
Как найти карту сайта, отличную от XML
XML — это наиболее распространенный формат карты сайта, который используется для информирования роботов о веб-страницах веб-сайта. Однако существуют и другие возможные форматы файлов Sitemap, которые роботы поисковых систем распознают и уважают:
- HTML , который обычно предназначен для пользователей, но также может помочь роботам находить веб-страницы. Расположение карты сайта HTML может быть
/sitemap/
. - RSS , где веб-сайт может использовать RSS-канал в качестве карты сайта. Расположение карты сайта RSS-канала обычно
/rss/
или/rss. xml
. - Atom , где веб-сайт может использовать фид Atom в качестве карты сайта. Расположение карты сайта фида Atom обычно
/атом.xml
. - TXT , который представляет собой просто текстовый файл. Расположение текстовой карты сайта часто
/sitemap.txt
.
Если вы обнаружите какие-либо из перечисленных выше типов карт сайта, не паникуйте. Они тоже в порядке, и Google их прекрасно понимает.
Карта сайта для Google — это просто список ссылок на страницы веб-сайта, которые владелец веб-сайта хочет просканировать и проиндексировать в Google.
Нашли карту сайта? Вот что делать дальше.
На картах сайта прямо из Google можно прочитать много интересного. Я настоятельно рекомендую вам проверить следующее:
- Основы карты сайта , чтобы узнать основы работы карты сайта.
- Разделение больших карт сайта , если вы имеете дело с огромными веб-сайтами.
- Карты сайта для видео , если вы анализируете веб-сайт с большим количеством видео.
- Файлы Sitemap для изображений , если на веб-сайте много ценных изображений.
Не нашли URL-адрес карты сайта в формате XML? Сделай это.
Скорее всего, на сайте просто нет карты сайта.
После того, как вы использовали различные способы поиска карты сайта, важно подумать, что делать, если она еще не создана. Это часто бывает с новыми веб-сайтами, которые не были в сети очень долго, или с очень маленькими и простыми сайтами.
Стоит отметить, что не все сайты требуют карты сайта. Если на вашем сайте всего несколько страниц, он должен нормально работать и без них.
Однако, если вы решите создать XML-карту сайта, для вашей системы CMS доступны плагины, которые упростят эту задачу. Например, если вы используете WordPress, некоторые хорошие варианты включают в себя:
- Rank Math, который имеет функцию создания XML-карты сайта,
- Yoast SEO, который также может автоматически создавать XML-карту сайта,
- Функция карты сайта WordPress по умолчанию,
- Google XML Sitemaps.
Кроме того, вы можете создать карту сайта вручную или использовать сканер для сканирования вашего веб-сайта и экспортировать карту сайта для загрузки. Важно помнить, что всегда есть варианты создания карты сайта, даже если их еще нет.
Часто задаваемые вопросы по XML-картам сайта и картам сайта
Вот наиболее часто задаваемые вопросы о картах сайта.
Что такое карта сайта?
Карта сайта — это файл, содержащий список всех страниц веб-сайта, которые вы хотите проиндексировать поисковыми системами. Он действует как дорожная карта, которая помогает роботам поисковых систем сканировать и понимать структуру вашего сайта.
Зачем мне нужно находить URL-адрес карты сайта?
Поиск карты сайта веб-сайта полезен для изучения страниц, сообщений и категорий блогов на конкретном веб-сайте. Это также помогает SEO-аудиторам оценить карту сайта и определить, требуется ли веб-сайту карта сайта для лучшей индексации поисковыми системами.
Каковы наиболее распространенные расположения файлов Sitemap в формате XML?
Общие расположения карт сайта XML включают /sitemap. xml, /sitemap_index.xml и /sitemap/. Эти местоположения обычно следуют за доменным именем веб-сайта.
Как найти URL-адрес карты сайта в файле robots.txt?
Чтобы найти карту сайта в файле robots.txt, добавьте /robots.txt к имени домена и просмотрите файл. Если указана карта сайта, она обычно отображается в файле в виде строки, показывающей расположение карты сайта.
Можно ли использовать операторы поиска Google для поиска карты сайта?
Да, вы можете использовать операторы поиска Google, такие как site:, filetype: и inurl:, чтобы найти карты сайта определенного типа или содержащие определенные ключевые слова в домене веб-сайта.
Как найти карту сайта в Google Search Console?
Чтобы найти карту сайта веб-сайта в Google Search Console, войдите в систему и перейдите в раздел «Карты сайта» в меню «Индекс». Если карта сайта в формате XML была отправлена в Google, она появится в разделе «Отправленные карты сайта».
Как найти карту сайта веб-сайта в Bing Webmaster Tools?
Чтобы найти карту сайта в Bing Webmaster Tools, войдите в систему и выберите «Карты сайта» на левой панели. Если какие-либо файлы Sitemap были отправлены, они появятся в разделе Sitemaps.
Существуют ли онлайн-инструменты для поиска карты сайта?
Да, существуют онлайн-инструменты, такие как SEO Site Checkup, которые могут помочь вам найти карту сайта веб-сайта. Просто введите URL-адрес веб-сайта и позвольте инструменту найти карту сайта.
Как найти карту сайта на основе CMS веб-сайта?
Большинство популярных систем управления контентом имеют свои карты сайта по умолчанию. Вы можете проверить эти местоположения по умолчанию или использовать такой инструмент, как CMS Detect, чтобы определить CMS, используемую веб-сайтом, а затем выполнить поиск карты сайта в соответствующем месте.
Что делать после того, как я нашел URL-адрес карты сайта?
Найдя карту сайта веб-сайта, вы можете просмотреть структуру и организацию сайта, проверить наличие ошибок сканирования или отправить карту сайта в поисковые системы, такие как Google и Bing, для улучшения индексации и улучшения видимости в поисковых системах.