Сайт

Правильный сайтмап: Sitemap.xml или карта сайта — руководство для новичков

29.08.2023

Содержание

Оптимизация Sitemap.xml для нужд SEO. Основные ошибки в xml-картах

XML карта сайта (sitemap.xml) — это файл в формате XML, в котором перечислены URL-адреса сайта, которые нужно сканировать и индексировать поисковыми системами.

Наличие xml-карт многие годы является отличной SEO практикой. Действительно, наличие качественных карт необходимо для того, чтобы поисковые системы сканировали и индексировали нужные страницы. Тем не менее, несмотря на повсеместное использование XML-карт сайта, их точное назначение не всегда полностью понимается оптимизаторами. И все еще существует некоторая путаница в отношении «идеальной» настройки карты сайта для оптимального сканирования и индексации.

Впервые опубликовано: 26/06/2018
Последние изменения: 4/12/2020

Содержание:

  1. Требования к xml-карте сайта
    1. Основы создания XML-карт сайта
    2. Атрибуты Sitemap
    3. Сочетание карты сайта с robots.txt и мета-тегами robots
  2. Оптимизация Sitemap. xml
    1. По размеру карты сайта
    2. По типу контента
    3. По актуальности
  3. Основные проблемы с xml-картами сайтов
    1. Мифы о сайтмапах
    2. Частые ошибки в sitemap.xml

1.Требования к xml-карте сайта

Если основное предназначение robots.txt – это запрет индексации, то xml-карта сайта sitemap.xml выполняет прямо противоположные задачи. Она отвечает за ускорение и полноту индексации сайта.

1.1.Основы создания XML-карт сайта

Нет необходимости подробно перечислять основы генерации XML-карт сайта, поскольку они уже неоднократно освещались в литературе. Я просто резюмирую здесь самое главное:

  1. XML-карты сайта должны соответствовать официальному протоколу, иначе поисковые системы не примут файл за действительный и проигнорируют его.
  2. Они должны содержать только индексируемые, канонические URL-адреса сайта, которые вы планируете для индексации.
  3. Можно отправить свою карту сайта в Google, Yandex и Bing непосредственно через Google Search Console и вебмастера поисковых систем, а также сослаться на неё в robots. txt сайта.
  4. Поисковая консоль Google и Инструменты для веб-мастеров сообщат об URL-адресах, включенных в XML-карты сайта, о том, проиндексированы они и есть ли с ними какие-либо ошибки или предупреждения.
  5. Существуют отдельные типы XML-карты сайта для веб-страниц, изображений, видео и новостных статей.

В этой статье мы сосредоточимся в основном на XML-файлах Sitemap для стандартных веб-страниц.

Общее число sitemap.xml на сайте не должно превышать 500 (ранее было 1000), при этом число записей в каждом не должно превышать 50 000 URL. Если необходимо перечислить более 50 000 URL-адресов, следует создать несколько файлов Sitemap.

Карту сайта можно сжать gzip архиватором для уменьшения его размера. Но объем каждого сайтмапа в развернутом (разархивированном) виде не должен превышать 50 мегабайт (ранее было 10).

Карта сайта не обязательно должна быть в виде xml файла. Протокол допускает генерацию карты в виде синдикации (RSS или Atom) либо в виде простого текстового файла с построчным перечислением URL. Но такие «карты сайта» либо не включают в себя все URL сайта (в случае с синдикацией), либо не несут дополнительную важную информацию (дата и время модификации контента страниц), собственно ради которой и используют в SEO карты сайта.

Предоставляя отметку времени последнего изменения <lastmod>, вы позволяете сканерам поисковой системы извлекать только часть файлов Sitemap в индексе, то есть сканер может извлекать только те файлы (страницы) сайта, которые были изменены после определенной даты. Этот механизм частичного извлечения файлов из Sitemap.xml позволяет быстро обнаруживать новые URL на сайтах больших размеров. Кроме того это позволяет снизить нагрузку как на сервер, так и на краулер поисковой системы.

1.2. Атрибуты Sitemap

XML-карты поддерживают несколько атрибутов для каждого URL. Вот три основных атрибута:

  • Дата последнего изменения (< lastmod >).
  • Приоритет страницы от 0,0 до 1,0 (< priority >).
  • Частота изменения содержимого URL-адреса (< changefreq >).

Многие XML-карты будут иметь все эти три атрибута, определенных для каждого URL, указанного в карте сайта. Однако большинство поисковых систем, включая Google, обращают внимание только на один из этих атрибутов: дату модификации < lastmod >. Если URL-адрес имеет дату < lastmod >, более позднюю, чем дата сканирования поисковой системой, это явный признак необходимости повторного сканирования URL.

Рекомендуется проверять наличие и точность атрибута и автоматически обновлять его при значительном изменении страницы на сайте. Большинство генераторов XML-карты сайта, например плагин Yoast SEO для WordPress, обеспечивают автоматическое обновление атрибута < lastmod > в XML-карте сайта при изменении страницы.

Два других атрибута: < priority > и < changefreq > считаются слишком «шумными», чтобы их можно было использовать в качестве правильных сигналов. Часто они устанавливаются так, чтобы попытаться обманом заставить поисковые системы сканировать страницы чаще чем необходимо, поэтому они игнорируются большинством поисковых роботов.

Рекомендуется полностью исключить эти атрибуты. Это уменьшит размер файла карты и упростит устранение неполадок с ней.

1.3. Сочетание карты сайта с robots.txt и мета-тегами robots

Инструкции sitemap.xml, robots.txt и метатегов robots при правильном их использовании должны дополнять друг друга. Существуют три важнейших правила взаимодействия этих инструкций:

  • sitemap.xml, robots.txt и метатеги robots не должны противоречить друг другу;
  • все страницы, исключенные (заблокированные) в robots.txt и метатегами robots, должны быть исключены также из sitemap.xml;
  • все индексируемые страницы, разрешенные в robots.txt, должны содержаться в sitemap.xml

Есть и исключения из этих трех правил. Например, оптимизаторы старой школы советуют добавлять в файл sitemap.xml только  не проиндексированные или изменившиеся страницы. При этом страницы, уже попавшие в индекс, следует удалять из xml-карты.

Применять этот способ или нет — на усмотрение оптимизатора. Думается, при сравнительно небольших размерах сайта и наличии поля lastmod, никакой нужды в таких вот изысках нет.

2. Оптимизация Sitemap.xml

В документации Google по XML- Sitemap говорится, что файл Sitemap не может содержать более 50 000 URL-адресов и не должен превышать 50 МБ в несжатом виде. Если на сайте более 50 000 URL-адресов, необходимо разбить их на отдельные карты сайта и отправить так называемый индекс карты сайта — XML-карту сайта в которой перечислены другие XML-карты.

2.1. По размеру карты сайта

Для крупных веб-сайтов с сотнями тысяч или миллионами страниц, обеспечение сканирования и индексации Google всех URL-адресов, представленных в XML-файлах Sitemap, является довольно сложной задачей. Использование в каждой карте сайта 50 000 URL-адресов иногда приводит к неполному сканированию и индексированию, при этом лишь незначительная часть отправленных URL добавляется в индекс Google.

В результате исследований было обнаружено, что ограничение размеров Sitemap до 10 000 URL приводит к более полному индексированию. Предполагается, что меньшие списки URL-адресов легче обработать и сканировать для Google.

В результате предлагается крупным сайтам использовать XML-карты меньшего размера, но при этом не следует слишком «мельчить». Я видел, как некоторые сайты — миллионники ограничивают XML-карту сайта 1000 URL-адресами, при этом они получают тысячи отдельных файлов карты сайта.

Это тоже вызывает сложности, так как Google Search Console в своих отчетах показывает только 1000 файлов Sitemap, следовательно, если у вас более 1000 отдельных XML-карт, вы не сможете получить полную оценку их производительности с точки зрения индексации из GSC.

Представляется, что лучше всего ограничить файлы 10 000 записями URL. Это отличный компромисс, который обеспечивает более полное сканирование и индексацию, чем карта с 50 000 адресами, при этом не создаются ограничения для отчетов в Google Search Console.

Максимум 10 000 URL на карту сайта XML кажется хорошим промежуточным звеном между индексацией и отчетностью. Впервые это исследовал NICK EUBANKS и получил отличные результаты.

2.2. По типу контента

При проведении SEO-аудитов и анализе проблем индексации, XML-карты являются крайне полезным подспорьем. Однако, если все URL-адреса сайта просто собраны вместе в XML-Sitemap, независимо от типа контента, устранение проблем затрудняется.

Отличный способ сделать XML-карты более полезными — разделить их по типу контента, чтобы для разных типов страниц существовали разные файлы XML-карты сайта.

Например, на коммерческом сайте — магазине могут быть разные файлы карты для страниц со статическим контентом (о компании, условия использования, контакты и пр.) и страниц категорий и подкатегорий, а так же страниц продуктов.

Или, например, можно сделать отдельные файлы XML-карты для каждой категории продуктов, чтобы было возможно быстро оценить индексацию отдельных категорий.

Новостным сайтам можно создавать отдельные карты для категорий (разделов) новостей и отдельно статей в них. Так мы сможем убедиться, что Google проиндексировал каждую страницу раздела на сайте (это важно для обнаружения новых статей), в то время как достичь 100% индексации для всех отдельных статей на новостном сайте крайне сложно.

Указание статей в отдельных XML-файлах от страниц разделов поможет более эффективно устранять потенциальные проблемы и получить более точные данные об эффективности индексации обоих типов страниц.

Не забывайте, что СМИ должны иметь отдельную XML-карту для свежих новостей, в которую добавляют статьи, опубликованные за последние 48 часов.

2.3. По актуальности

Еще одним интересным подходом в оптимизации карт сайтов является консолидация URL по актуальности.

Например, все старые и не обновляемые URL мы можем собрать в отдельных картах сайта, таких как sitemap-1.xml, sitemap-2.xml, sitemap-3.xml и т.д. А все новые или обновленные статьи мы добавляем в отдельную карту, например sitemap-new.xml. Как только страница будет переиндексирована или спустя определенный промежуток времени (например 1 месяц), мы переносим URL в последний архивный sitemap, удаляя его из sitemap-new. xml.

Если какая то страница из архивных претерпела изменения, то мы удаляем её из, например, sitemap-2.xml и переносим в sitemap-new.xml, где она будет дожидаться либо переиндексации, либо определенный срок (тот же месяц) и опять будет перенесена в последнюю «архивную» карту сайта.

Таким образом, постоянной перезагрузки будет требовать только 1 карта сайта — sitemap-new.xml. Это позволяет экономить бюджет сканирования, при этом мы можем добиться крайне быстрой и полной индексации материалов сайта.

Все приведенные выше способы оптимизации можно комбинировать и модифицировать.

3. Основные проблемы с xml-картами сайтов

3.1. Мифы о сайтмапах

Распространенным заблуждением о XML-картах является уверенность в том, что они могут заменить сканирование роботом сайта. Якобы, при наличии хорошей XML-карты сайта сам сайт не обязательно должен быть полностью просканированным. В конце концов, рассуждают товарищи, что URL-адреса необходимые для сканирования перечислены в XML-карте, поэтому на сайте не обязательно должны быть ссылки на URL-адреса для сканирования. Это неверно.

Основным механизмом, с помощью которого поисковые системы обнаруживают контент, является сканирование сайта роботом. Поэтому у сайта должна быть хорошая структура внутренних ссылок, которая позволит сканерам найти все важные страницы с минимальным количеством кликов.

Что более важно, именно ссылки позволяют получить страницам PageRank (вернее InRank), без которого контент сайта не будет ранжироваться в результатах поиска.

XML- карты не заменяют внутренние ссылки. Ссылки в них не передают вес и не гарантируют индексацию и ранжирование контента. Карты являются дополнительным сигналом для поисковых систем. Они не предназначены для подмены правильной структуры сайта.

Вы должны убедиться, что сайт полностью просканирован и все URL, перечисленные в XML-карте сайта, можно обнаружить используя навигацию сайта.

Если URL указан в карте сайта, но не имеет открытых входящих ссылок, указывающих на него, маловероятно, что поисковые системы просканируют этот URL-адрес и скорее всего он абсолютно не будет ранжироваться в выдаче.

3.2. Частые ошибки в sitemap.xml

Занимаясь техническими аудитами сайтов, я очень редко вижу по настоящему правильные, безошибочные карты сайтов. Подавляющее большинство карт сайтов имеет многочисленные проблемы, среди которых наиболее часто встречаются следующие:

  1. Устаревшие XML-карты сайта — т.е. несоответствие страницам сайта. Эта проблема возникает, когда сайтмап генерируется не динамически, а эпизодически, запуском какой то службы в CMS, а то и сторонними сервисами. При этом возникает масса мертвых страниц, отдающих 404 ошибку (это если страницу физически удалили или перенесли в другое место, сменили адрес URL). Кроме того, новые страницы индексируются значительно медленнее, ибо не находятся в sitemap.xml.
  2. URL-адреса не в файле Sitemap. Эта ошибка очень часто обусловлена предыдущей. При этом ряд страниц сайта не попадают в карту. Это может быть сделано и специально (когда владелец не желает включать в карту ненужные или малоценные страницы). В большинстве случаев необходимо обновить XML Sitemap, чтобы добавить в карту эти страницы.
  3. Включение в карты сайта неканонических, не индексируемых страниц. В картах сайта должны находится только страницы, открытые для индексации, отдающие код 200. Неканонические страницы, страницы закрытые для индексации в robots.txt или мета-тегами robots, переадресации, страницы генерирующие 404 код, 503 код и прочие — не должны находится в рабочей карте сайта.
  4. Неверная структура sitemap.xml. Эта ошибка возникает, как правило, на «самописных» CMS или при использовании неверных плагинов к популярной CMS. При этом генерируется файл sitemap.xml с нарушением структуры, описанной протоколом.
  5. Отсутствие или неверная работа с датой изменения записи. С точки зрения протокола — это не ошибка, так как поле lastmod не является обязательным. С точки зрения SEO и поисковых систем, отсутствие правильного значения в этом поле (совпадающее с непосредственным изменением контента) — полностью нивелирует значимость всего файла sitemap. xml. Как было сказано выше, ПС будут переиндексировать те страницы, поле lastmod которых изменилось.Что произойдет, если это поле меняется одновременно у всех записей (страниц) сайта. То есть дата модификации одинакова у всех файлов сайта. Скорее всего, ПС не будут обращать внимание на sitemap и сайт будет переиндексироваться обычным способом, при этом глубоко расположенные страницы либо не переиндексируются вовсе, либо будут переиндексироваться очень долго.Итак, Необходимо или вовсе не использовать поле lastmod (что плохо), либо ставить дату последнего значимого изменения страницы, например, когда поменялась цена или товар закончился или изменилось описание.
  6. Логические ошибки, вызваны нарушением трех правил о сочетании robots.txt и sitemap.xml. В этом случае можно наблюдать постоянное попадание страницы в индекс и немедленный вылет оттуда. Однако, это не будет наблюдаться при наличии метатега noindex и записи в Sitemap.xml. В этом случае краулер (робот, паук ПС), зашедший на страницу индексировать её не будет.
  7. Наличие Orphan page («осиротевших страниц»). Это такие страницы, на которые стоит ссылка из sitemap, но нет ни одной прямой ссылки с любой из страниц сайта. Либо страница, на которой стоят ссылки на «утерянную страницу» была закрыта от индексации либо она не является канонической. Часто это связано с тем, что страницы были удалены «логически» (например в WordPress помещены в корзину), а не физически. Это так же наблюдается на сайтах, где доступ к карточкам товаров сделано на скриптах и фильтрах способом, который не позволяет проиндексировать результаты работ этих скриптов. Возможны и иные причины возникновения таких страниц-сирот. Все это снижает доверие поисковых систем к сайту и является негативным сигналом ранжирования.
  8. Страница одновременно расположена в нескольких файлах Sitemap Это не обязательно является ошибкой, но обычно каждый URL-адрес должен быть расположен только в одном XML-файле Sitemap.

Согласно протокола, после изменения сайтмапа, можно перепинговать поисковые системы. Для этого нужно создать запрос следующего вида:

<searchengine_URL>/ping?sitemap=sitemap_url

Обязательно добавляйте сайтмапы в вебмастера и проверяйте их на серьезные ошибки.

4
Дек
2020

  Посмотрите еще
  • Пошаговый аудит контента
  • Mobile-First Index — убийца оптимизаторов от Google
  • Голосовой поиск и SEO оптимизация сайта под него в 2018 году

Комментарии

Правильный блог на Rails: sitemap, robots и rss

АВТОР: ЕВГЕНИЙ БУРМАКИН

Многие начинающие (и опытные) ruby-разработчики со временем задаются целью перенести свой существующий блог на Rails или завести новый, используя этот фреймворк. Простейшие сущности, такие как сами посты, авторизация и комментарии делаются в два счета, но то, что получается в итоге на блог пока еще не тянет. Полноценному блогу, как и многим сайтам и сервисам, помимо базового функционала требуется еще несколько составляющих. О них и пойдет речь.

Во-первых, это RSS-лента. Любой блог, новостной сайт или сервис, где есть раздел со статьями, должен предоставлять посетителю возможность подписаться на RSS-фид, чтобы тот не пропустил очередную запись. Во-вторых, sitemap, или карта сайта. Полезная вещь, если вы хотите, чтобы ваш сайт был более дружелюбен к индексации поисковыми системами. Третий и последний пункт — robots.txt, инструкция для поисковиков о том, что индексировать не стоит. Мало кому захочется, чтобы в поисковой выдаче Яндекса или Гугла оказалась страница, приглашающая войти в администраторскую часть сайта.

RSS

Для вещания RSS-фида создадим отдельный контроллер: rails g controller Home index. Как видно из команды, за отдачу постов блога отвечает экшен Home#index. Наполним контроллер содержимым:

class HomeController < ApplicationController
  layout false
  def index
    @posts = Post.order(created_at: :desc)
  end
end

Поскольку нам не нужно, чтобы экшен рендерил layout, мы это дело отключаем строкой layout false.

В экшене Home#index создаем переменную экземпляра, которая будет содержать посты, отдаваемые в RSS. Далее редактируем файл config/routes.rb, добавляя в него адрес созданного RSS-фида:

  get 'feeds', to: 'home#index', format: 'rss'

Теперь необходимо описать файл, который будет формировать наш RSS. Поскольку RSS-лента всегда отдается в формате XML, наш код будет формировать именно XML-документ на выходе, а сам файл, содержащий ruby-код, будет иметь расширение .builder. При обработке файлов с этим расширением используется библиотека builder, которая и занимается созданием XML-документа. Отправляемся в директорию

app/views/home/ и создаем в ней файл index.builder:

xml.instruct!
xml.rss version: '2.0', 'xmlns:atom' => 'http://www.w3.org/2005/Atom' do
  xml.channel do
    xml.title 'Название блога'
    xml.description 'Описание блога'
    xml.link root_url
    xml.language 'ru'
    xml.tag! 'atom:link', rel: 'self', type: 'application/rss+xml', href: 'home/rss'
    for post in @posts
      xml. item do
        xml.title post.title
        xml.link post_url(post)
        xml.pubDate(post.created_at.rfc2822)
        xml.guid post_url(post)
        xml.description(h(post.content))
      end
    end
  end
end

Обратите внимание на содержимое блока xml.item do — в нем вам необходимо будет изменить значения post.title и post.content на собственные, в зависимости от того, какие атрибуты вы создали для вашей модели публикаций.

Последний шаг этой задачи — добавление ссылки на RSS-фид в раздел <head> файла app/views/layouts/application.html.erb. Это необходимо для того, чтобы браузеры пользователей автоматически могли распознать вашу RSS-ленту.

<link href="/feeds" rel="alternate" title="RSS feed" type="application/rss+xml">

Готово, теперь ваш RSS-фид доступен по адресу

localhost:3000/home/rss.

Sitemap

Для создания карты сайта будет использоваться гем DynamicSitemaps. Установка стандартная: добавляем gem 'dynamic_sitemaps' в Gemfile и устанавливаем его командой bundle install. Команда rails generate dynamic_sitemaps:install создаст файл config/sitemap.rb. Настроим его под наш проект:

host "mkdev.me"
sitemap :site do
  url root_url, last_mod: Time.now, change_freq: "daily", priority: 1.0
  url posts_url
  Post.all.each do |post|
    url post
  end
end
ping_with "http://#{host}/sitemap.xml"

Как видно из кода, гем позволяет не только создавать карту сайтов, но и уведомлять поисковики о появлении новых публикаций. Возможности гема этим не ограничиваются, поэтому рекомендую ознакомиться с документацией гема по ссылке, указанной в начале раздела Sitemap. Для непосредственной генерации самой карты сайта используем команду rake sitemap:generate. Это создаст файл sitemap.xml в директории public/sitemaps/. Теперь создадим в нашем контроллере Home экшен sitemap со следующим содержимым:

def sitemap
  respond_to do |format|
    format.
xml { render file: 'public/sitemaps/sitemap.xml' } format.html { redirect_to root_url } end end

Закончим начатое, добавив адрес карты сайта в файл config/routes.rb:

  get 'sitemap' => 'home#sitemap'

Помните, что карта сайта в описанной конфигурации не генерируется сама по себе, используйте whenever для ежедневного её обновления выполнением команды rake sitemap:generate.

robots.txt

Для файла robots.txt создадим еще один экшен в контроллере Home. В нем опишем все посты, которые хотим закрыть для индексации поисковиками:

def robots
  @posts = Post.where(published: false)
end

Экшену понадобится файл вьюх, создадим его по адресу

app/views/home/ и назовем robots.text.erb. Содержимое файла будет динамически формировать наш robots.txt таким образом, чтобы он всегда поддерживался в актуальном состоянии:

User-agent: *
<% @posts.each do |p| %>
Disallow: <%= post_url(p) %>
<% end %>
Sitemap: http://mkdev. me/sitemap.xml

В конце файла так же рекомендуется оставить ссылку на карту сайта, как это показано на примере выше. Финальный штрих — редактирование config/routes.rb, добавим строку в конец файла:

  get 'robots' => 'home#robots', format: :text

На этом все, теперь блог стал более дружелюбен к пользователям и поисковикам.

Примечание редакции

Мы (команда mkdev) настоятельно рекомендуем воздерживаться от использования Rails для написания своего блога. Возьмите WordPress, если вам нужен блог. Придумайте что-нибудь поинтереснее, если вам нужно научиться писать веб-приложения 😉

Распространенные ошибки файлов Sitemap и способы их исправления

Последнее редактирование: 12 мая 2015 г., автор: Суперпользователь в файлах Sitemap

Создание карты сайта XML или HTML больше не проблема. Существует множество генераторов карт сайта и плагинов, которые вы всегда можете использовать. Однако, если вы не отформатируете и не отправите его надлежащим образом, вы рискуете столкнуться с рядом ошибок. В этой статье объясняются некоторые из наиболее распространенных ошибок и способы их устранения для успешной отправки файлов Sitemap в инструменты Google для веб-мастеров. После успешного исправления ошибок вы должны повторно отправить карту сайта.

Сделать это в Google;

  1. Перейдите на главную страницу инструментов для веб-мастеров
  2. Перейти на сайт
  3. Нажмите на файлы Sitemap в разделе «Сканирование»
  4. Выберите карты сайта, которые вы хотите отправить повторно
  5. Нажмите кнопку «Повторить отправку», чтобы завершить процесс
  6. .

1. Ошибка сжатия

Эта ошибка означает, что ваша карта сайта не может быть обработана Google, поскольку ее невозможно распаковать. Это характерно для сжатых карт сайта, которые отправляются в архивном файле, таком как .zip.

Решение:

Чтобы это исправить, просмотрите карту сайта и сожмите ее еще раз. Загрузите новый файл архива и повторите отправку в Инструменты для веб-мастеров.

2. Пустая карта сайта

Скорее всего, вы столкнетесь с этой ошибкой, если отправленная карта сайта пуста. Неправильная пометка URL-адресов в карте сайта также может привести к этой ошибке, поскольку боты Google не могут обнаружить информацию в формате.

Решение:

Начните с проверки карты сайта, чтобы убедиться, что она действительно не пуста. Убедитесь, что URL-адреса правильно помечены. Эта информация доступна в руководстве по картам сайта, которое вы должны прочитать и понять, прежде чем даже думать о создании карт сайта.

3. Ошибка HTTP (конкретный код)

Это просто означает, что карта сайта не может быть обработана или боты столкнулись с какой-то ошибкой HTTP, которая не очень критична, особенно при попытке загрузить карту сайта. Обратите внимание, что некоторые ошибки, такие как 404, являются критическими, но другие могут просто показывать временные ошибки, такие как проблемы с сервером.

Решение:

Подтвердите, действительно ли указанный URL-адрес карты сайта точен и доступен в указанном месте. Если вы уверены, просто повторно отправьте карту сайта в Инструменты Google для веб-мастеров.

4. Неверное пространство имен.

Пространство имен — это набор имен, которые можно использовать в качестве элементов и атрибутов в XML-файле. Когда вы указываете пространство имен в файле XML, вы просто сообщаете Google, какие данные содержатся в карте сайта, а также их соответствующие теги.

Решение:

Еще раз просмотрите карту сайта и убедитесь, что пространство имен указано правильно. Убедившись, что все в порядке, повторно отправьте карту сайта.

Существует множество других ошибок, с которыми вы можете столкнуться при отправке карты сайта в инструменты для веб-мастеров. Лучший способ сделать это — внимательно прочитать и понять правила создания и отправки файлов Sitemap. Если вы используете сторонний генератор карты сайта, постарайтесь просмотреть созданную карту сайта, прежде чем нажимать «отправить». Поскольку за отправку файлов Sitemap не предусмотрены штрафы, некоторые ошибки могут дорого обойтись. Вы можете использовать ошибки, чтобы также улучшить общее взаимодействие с пользователем, обеспечив отсутствие мертвых ссылок или используя robots.txt. Если вы заинтересованы в отправке в другие популярные поисковые системы, прочитайте статью Как отправить карту сайта в поисковые системы.


Назад

XML Карта сайта: Полное руководство для оптимизаторов

Карта сайта содержит все подстраницы вашего сайта, которые должны быть проиндексированы Google. Поскольку она написана в стандартизированном формате XML, ее также называют XML-картой сайта. С помощью карты сайта вы помогаете Google сканировать ваш сайт. Обычно он находится в главном каталоге домена и может быть вызван оттуда. Если карта сайта находится в подкаталоге, ее можно использовать только для этого подкаталога, то же правило действует и для поддоменов.

Файлы Sitemap не могут содержать более 50 000 URL-адресов и не могут превышать 50 МБ. Если ваша карта сайта превышает одно или несколько из этих чисел, вам нужно будет создать более одного.

Некоторые рекомендации по поисковой оптимизации и картам сайта:

  1. Что такое карта сайта для изображений?
  2. Что такое карта сайта для новостей?
  3. Что такое карта сайта HTML?
  4. Как отправить карту сайта в поисковую систему?

Происхождение карт сайта

В 2005 году компания Google представила карты сайта для веб-мастеров и веб-разработчиков, чтобы они могли содержать все необходимые и важные URL-адреса в одном месте для поисковой системы. Первой действительной версией Sitemap для Google была 0.84. В ноябре 2006 года Yahoo, Microsoft и Google создали Общий механизм для отправки веб-сайтов. В апреле 2007 года IBM, а также Ask.com присоединились к Общему механизму отправки веб-сайтов. Google и Yahoo запустили процесс автоматического обнаружения файлов карты сайта с помощью файлов robots.txt. Вы можете увидеть первое объявление Google, связанное с файлами Sitemap, ниже:

Происхождение карты сайта от 2005 года.

Кроме того, ниже вы можете увидеть Декларацию об общем механизме отправки веб-сайтов Google, Yahoo и Microsoft:

Поисковые системы и общий механизм отправки веб-сайтов.

Какие элементы учитываются Google?

Первые две строки определяют схему XML для нашей карты сайта и указывают, что используется кодировка UTF-8.

  • Loc  обозначает URL-адрес, указанный в карте сайта.
  • lastmod  показывает, когда последний раз изменялся URL-адрес. В нашем примере это было 1 января 2005 года. По этой записи поисковая система распознает, когда сообщение было обновлено, и, прежде всего, стоит ли сканировать страницу еще раз. Обозначается в формате W3C DateTime. Год впереди, а день сзади. Элемент lastmod учитывается Google при сканировании.
  • Changefreq  необязателен и описывает частоту изменений, т. е. как часто URL-адрес может изменяться. Здесь принимаются следующие значения: всегда, ежечасно, ежедневно, еженедельно, ежемесячно, ежегодно и никогда. При использовании Always URL меняется при каждом вызове. Никогда используется только для заархивированных URL. В нашем примере URL (скорее всего) будет обновляться каждый месяц. Changefreq — это только рекомендация для Google, а не заказ. URL-адрес с changefreq ежечасно может сканироваться реже, а URL-адрес с годовым можно сканировать чаще, чем один раз в год. Даже если URL содержит слово «никогда», время от времени появляется поисковый робот. Если вы не знаете, что вводить здесь, вы можете оставить этот элемент пустым.
  • Приоритет  означает, насколько важен URL во всем домене. Диапазон значений от 0,0 до 1,0. По умолчанию 0,5. Это значение игнорируется Google, поэтому его также можно опустить.

1. Декларация XML

  

Это просто говорит о том, что наша карта сайта имеет формат XML и кодируется набором символов UTF-8. Он также указывает версию XML.

2. Набор URL

  sitemaps.org/schemas/sitemap/0.9"> 

Это контейнер всех URL-адресов в карте сайта. Он также указывает используемую версию карты сайта. В данном случае наша версия карты сайта — 0.9, она поддерживается Microsoft, Google и Yahoo.

3 .URL

 
 https://www.holisticseo.digital/ 
2020-07-21T16:12:20+03:00
 

Каждая карта сайта начинается с наиболее подходящего URL-адреса. Но, тем не менее, Google не заботится о порядке URL-адресов в файлах Sitemap для заказов на сканирование. Они собирают URL-адреса и ставят их в очередь для сканирования в соответствии со своими внутренними алгоритмами сканирования. Каждый URL-адрес следует использовать как абсолютный, а не относительный URL-адрес. Кроме того, каждый URL-адрес должен быть оригинальным, любой канонический URL-адрес, дублированный URL-адрес страницы или страница без кода состояния 200 не должны быть в карте сайта. Каждый URL-адрес в карте сайта должен быть URL-адресом, который необходимо проиндексировать.

также означает местоположение, оно указывает местоположение URL-адреса.

указывает дату последнего изменения URL-адреса в формате даты W3Schoold. Если бы мы обновили контент 29 декабря 2020 года, он превратился бы в 2020-12-29.

Ответ от Garry Illyes, связанный с необходимостью Lastmod для SEO.

<приоритет> говорит о важности URL для сканирования. В старые времена Google заботился об этом свойстве в карте сайта, но большинство SEO-специалистов, как всегда, использовали его для манипулирования поисковой системой. По этой причине Google создал новые показатели, такие как популярность внутренних ссылок, PageRank, трафик или исторические данные, чтобы понять важность URL-адреса на веб-сайте.

Гарри также сообщает об этом в Твиттере. «Настройка приоритета — это мешок шума».

«» предназначен для указания частоты изменения URL-адреса, чтобы поисковая система могла определить частоту сканирования. Раньше Google мог обновлять свой индекс только раз в месяц. Через некоторое время он начал обновлять все индексы через 3-4 дня. После обновления Google Caffeine он начал обновлять индекс для каждой веб-страницы отдельно. — это старое свойство в Sitemap для тех дней, когда поисковые системы медленно сканируют и индексируют. Кроме того, оптимизаторы начали использовать эту метрику для манипулирования поисковой системой, поэтому Google создал свои собственные метрики.

Вы можете найти приведенную ниже цитату Джона Мюллера, связанную с :

Приоритет и частота изменений больше не играют такой большой роли в файлах Sitemap.

Это то, где мы пробовали разные вещи, но, по сути, если у вас есть файл карты сайта, и вы используете его, чтобы сообщить нам о страницах, которые были изменены или обновлены, гораздо лучше просто указать отметку времени напрямую, поэтому что мы можем заглянуть в наши внутренние системы и сказать, что мы не сканировали с этой даты, поэтому нам нужно сканировать снова.

И просто ежедневное сканирование не имеет особого смысла, если ваш контент не меняется. Так что это то, где мы видим много сайтов, они дают нам эту информацию в карте сайта, они говорят, что она меняется ежедневно или еженедельно, и мы смотрим в нашу базу данных, и она не изменилась за месяц или годы…

И что? Я действительно рекомендую использовать метку времени.

Джон Мюллер

XML, RSS, текст: какие форматы все еще доступны для файлов Sitemap?

Google принимает различные форматы файлов Sitemap. Наиболее распространенным является формат XML, описанный выше. Кроме того, Google также может читать другие форматы.

  • RSS:  Если у вас есть блог с RSS-каналом, вы также можете отправить URL-адрес своего канала. Принимаются каналы RSS 2.0 и Atom 1.0. С помощью мультимедийного RSS-канала вы по-прежнему можете предоставлять Google информацию о видео на вашем веб-сайте. Помните, что RSS-канал содержит только текущие URL-адреса.
  • Текстовый файл:  Если ваша карта сайта должна содержать только URL-адреса веб-сайтов и никакой другой информации, вы также можете создать текстовый файл. В каждой строке есть только один URL-адрес, и все это сохраняется в формате .txt.
  • Сайты Google:  Если вы создали свой веб-сайт с помощью Сайтов Google, карта сайта будет создана автоматически. Однако это не передается автоматически в Google, вы можете сделать это самостоятельно. Как отправить карту сайта, описано ниже в статье.
  • XML: В , на мой взгляд, лучшее решение для вашей карты сайта. Стандартизированный формат гарантирует, что Google получит всю необходимую информацию.
  • Карта сайта в формате HTML: карты сайта в формате HTML для отображения всех URL-адресов пользователям, а не поисковым системам. Поскольку это не имеет прямого отношения к SEO, я рекомендую вам прочитать наше Руководство по HTML-карте сайта.

Карта сайта хороша для ранжирования, верно?

Карта сайта не является прямым фактором ранжирования, но помогает Google легче находить ваш контент и быстро распознавать изменения. Особенно с новыми веб-сайтами стоит как можно скорее уведомить Google о появлении новых URL-адресов. Таким образом, ваши страницы будут проиндексированы быстрее, и вы сможете напрямую контролировать, какие страницы должны быть включены в индекс.

Нужен ли мне файл Sitemap в формате HTML?

В отличие от карты сайта в формате XML, карта сайта в формате HTML помогает пользователям ориентироваться на странице, подобно оглавлению. Карта сайта в формате HTML не заменяет карту сайта в формате XML, но может рассматриваться как дополнение к ней.

Карта сайта в формате HTML от Samsung показывает пользователю, какие существуют категории. Он служит ориентиром для пользователя.

Как видите, показанная выше HTML-карта сайта содержит информацию о категориях и структуре для пользователя. В отличие от XML-карты сайта, HTML-карта сайта представляет собой отдельную подстраницу, которая обычно связана в нижнем колонтитуле и поэтому видна вашим пользователям.

Зачем мне нужен файл Sitemap в формате XML?

Как вы уже прочитали выше, карта сайта не имеет отношения к ранжированию, а также есть некоторые страницы, на которых ее нет. Тем не менее, есть некоторые преимущества, которые дает карта сайта:

  • Google быстрее обнаруживает изменения:  Если добавляются новые URL-адреса, вы можете сообщить об этом Google с помощью карты сайта. Это поможет Google сканировать.
  • Новые веб-сайты индексируются быстрее:  Ваш веб-сайт все еще свеж, и Google должен сначала узнать, что он существует. С помощью карты сайта вы можете активно сообщать Google, что есть что-то новое.
  • Ваши страницы не связаны друг с другом:  Если ваш контент страниц не связан  друг с другом, вы используете карту сайта, чтобы Google все равно нашел их. Таким образом, они не будут упущены из виду при ползании. Конечно, карта сайта не заменит продуманную внутреннюю ссылку!
  • Ваша страница обширна:  Если на вашей странице много URL-адресов, карта сайта снижает вероятность того, что что-то не будет просканировано.
  • Даже если у вас есть мультимедийный контент  или вы хотите, чтобы он отображался в Новостях Google , Google также может учитывать дополнительную информацию в карте сайта. Для Новостей Google вам также понадобится отдельная карта сайта.

Как видите, есть веские причины для карты сайта. Сам гугл говорит, что карта сайта не гарантирует, что все будет просканировано, но минусов нет.

Что делать, если у меня нет карты сайта?

Тогда создайте! Вы можете легко создать их в своей системе управления контентом (CMS) или вручную. Но я рекомендую первый вариант.

Насколько большим может быть файл Sitemap?

Карта сайта может содержать не более 50 000 URL-адресов и не более 50 мегабайт. Если у вас большой веб-сайт, карта сайта должна быть разделена. В зависимости от того, какую CMS вы используете, это может происходить автоматически. Отдельные карты сайта связаны в индексном файле карты сайта. Все это выглядит так:

Вы можете увидеть эту карту сайта, перейдя по ссылке www.seokratie.de/sitemap.xml.

Что такое XML-индекс карты сайта?

Если вы превысите ограничения для карты сайта, вам необходимо разделить ее на несколько карт меньшего размера и проиндексировать эти карты. Это отдельный файл, который включает в себя все карты на вашем сайте.

Пример:

 

<карта сайта>
http://www.example.com/sitemap1.xml.gz
2004-10-01T18:23:17+00:00

<карта сайта>
http://www.example.com/sitemap2.xml.gz
2005-01-01

 

Этот индекс включает две карты сайта XML: sitemap1.xml.gz и sitemap2.xml.gz . Теперь мы объясним этот файл по частям.

Заголовок XML

В этом нет ничего нового, заголовок индекса (как и заголовок карты сайта XML) определяет стандартную версию XML и кодировку символов .

Определение Sitemapindex

Вместо определения urlset здесь следует определить как индекс карты сайта. Это определение охватывает все карты сайта и указывает, какая версия стандарта XML использовалась. Точно так же, как определение urlset  закрывается в нижней части документа:

Определения файлов Sitemap

 
http://www.example.com/sitemap1.xml.gz
2004-10-01T18:23:17+00:00
 

Наиболее важными разделами карты сайта являются теги и . Тег показывает расположение URL-адреса на карте сайта для поисковых роботов, а тег показывает дату последней модификации контента в теге .

Кроме этого, также возможно определить lastmod как дату последней модификации карты сайта XML в формате «W3C».

Каким критериям должен соответствовать файл Sitemap, чтобы он соответствовал рекомендациям Google?

Чтобы ваша карта сайта была безошибочной и принималась Google, должны быть выполнены некоторые требования. Я скажу вам, что это такое.

Общие рекомендации :

  • Ваш файл карты сайта должен быть закодирован в формате UTF-8, и соответствующие escape-коды должны быть сохранены, если некоторые символы не могут отображаться правильно.
  • Убедитесь, что ваша карта сайта содержит URL-адреса только из того же домена. Если у вас несколько доменов, каждый домен получает свою карту сайта.
  • Ваша карта сайта может содержать только тот контент, который должен быть проиндексирован и действительно доступен. Вы можете увидеть возможные ошибки в карте сайта в Google Search Console.

Используйте согласованные URL-адреса

Google сканирует ваши URL-адреса в точности так, как вы вводите их в свою карту сайта. Так что будьте последовательны и не смешивайте разные варианты написания. С картой сайта HolisticSEO.Digital выглядит так:

Отдельные URL-адреса в карте сайта HolisticSEO.Digital.

Мы все даем наши URL-адреса в такой форме: https//www. HolisticSEO.Digital/. Старайтесь не опускать «www» в некоторых URL-адресах или использовать относительные URL-адреса.

Как создать XML-карту сайта в системе управления контентом

Большинство систем управления контентом, таких как WordPress, имеют соответствующее расширение, с помощью которого вы можете легко создать карту сайта для своего веб-сайта. Давайте посмотрим, как создать карту сайта в WordPress.

Во-первых, вам нужен плагин, который поможет вам в его создании. При выборе плагина убедитесь, что он хорошо написан. Вы можете увидеть это, например, в рейтингах и количестве пользователей, которые его используют. Хорошо написанные плагины учитывают  Rel = Canonical и Noindex , тогда как плохие плагины просто включают все в карту сайта. В этом примере мы используем плагин Yoast . Это так просто:

  1. Перейдите к кнопке «Общие» в настройках Yoast, а затем нажмите «Функции» вверху.
  2. Активировать «XML карты сайта». Нажав на вопросительный знак, вы можете отобразить дополнительную информацию. Если вы активировали эту функцию, Yoast автоматически создает XML-карту сайта для вашей страницы.

Если переключатель установлен в положение «Вкл.», Yoast автоматически создает карту сайта.

Нажав «Просмотреть XML-карту сайта», ваша карта сайта откроется в новой вкладке. Ссылка понадобится вам позже, если вы захотите отправить карту сайта в Google.

Если вы хотите, чтобы сообщения исключались из результатов поиска, вы можете установить это в разделе «Отображать в поиске» и в разделе «Типы контента». После этого ваши материалы получат метатег robots   noindex и не будут включены в карту сайта. Так как я очень хочу, чтобы мои посты появлялись в результатах поиска, то переключатель остается на «Да».

В настройках для определенных типов содержимого можно установить значение noindex.

В разделе Таксономии вы по-прежнему можете решить, должны ли категории также отображаться в результатах поиска. Здесь также применимо следующее: если переключатель выключен, страницы категории имеют значение noindex и поэтому не отображаются в карте сайта.

Практичная вещь, если у вас есть карта сайта, созданная с помощью CMS: она всегда актуальна и менее подвержена ошибкам. Чем больше становится ваша страница, тем сложнее вручную просматривать контент, особенно если что-то меняется. Вот почему я рекомендую вам всегда автоматически создавать XML-карты сайта.

Как вручную создать XML-карту сайта для вашего веб-сайта

Кроме того, вы также можете создать карту сайта вручную. Вы действительно должны делать это, только если вы не используете CMS. Но помните: если вы создаете карту сайта вручную, вам придется создавать ее каждый раз, когда что-то меняется по любому URL-адресу. Вот почему я рекомендую вам использовать для этого инструмент, а не нажимать на карту сайта вручную.

Например, вы можете использовать XML-sitemaps.com. Он даже распознает Noindex и Canonical  элементов и не добавляет соответствующие URL-адреса в карту сайта. Существует также Pro-версия этого инструмента, которая автоматически обновляет карту сайта при внесении изменений. Если вы используете только обычную версию, вам нужно создавать новую карту сайта каждый раз, когда ваша страница изменяется. Вы можете быстро потерять след.

Как создается ваша карта сайта с Screaming Frog , объясняет Луиза в своем блоге.

Лучше всегда создавать свою карту сайта автоматически, иначе быстро закрадутся ошибки, которые потом приведут к проблемам в индексации. Вы можете узнать, какие элементы приводят к ошибкам в следующем абзаце.

Чего не должно быть в вашем файле Sitemap?

К сожалению, снова и снова карты сайта содержат элементы, которые им не принадлежат. Я уже писал, что в вашей карте сайта разрешена только та информация, которая должна быть проиндексирована и действительно доступна. Если у вас в карте сайта есть ошибочные страницы или редиректы, значит, есть проблемы со сканированием. Эти элементы ничего не потеряли в вашей карте сайта:

  • Дубликаты URL:  Должна быть проиндексирована только правильная версия каждого URL. Так что смысла в 9 нет.0029, включая seokratie.de/blog и seokratie.de/blog/ в карте сайта. Выберите одну из двух версий.
  • URL-адреса с каноническим тегом:  Если на странице есть канонический тег, это означает, что Google не должен ее индексировать. Однако, если он все еще появляется в вашей карте сайта, это посылает противоречивые сигналы. Все, что указано в карте сайта, также должно быть проиндексировано. Избегайте URL-адресов с каноническим тегом в карте сайта, чтобы избежать конфликтов во время сканирования.
  • Идентификаторы сеанса:  Если идентификаторы сеанса находятся в URL-адресе страницы, при каждом посещении страницы создается уникальная ссылка. Поскольку ссылка меняется при каждом посещении страницы, для робота Googlebot она выглядит как дублированный контент.
  • Страницы с кодом состояния 404/410:  Эти страницы сообщают об ошибке  и им не место в вашей карте сайта. Либо удалите соответствующие записи из карты сайта, либо сделайте ссылки снова рабочими.
  • Перенаправления:  В вашей карте сайта должны быть указаны только уникальные URL-адреса. Перенаправления вводят робота Google в заблуждение.
  • Страницы с тегом noindex:  Как и в случае  Canonical –  день, при указании страницы  Noindex- aufnimst day в файле Sitemap отправляются противоречивые сигналы. Эти страницы должны оставаться снаружи.
  • Изображения:  В обычной карте сайта указаны только URL-адреса содержательных страниц. Если у вас есть много изображений, которые вы хотите проиндексировать, используйте карту сайта для изображений. Я объясню вам кое-что ниже.

Как отправить карту сайта в Google?

Теперь вы успешно создали карту сайта для своего веб-сайта, но как Google узнает, что она у вас есть?

Ссылка на карту сайта в robots.txt

Сначала сохраните карту сайта в robots. txt. Этот файл помогает поисковым роботам ориентироваться на вашем веб-сайте. Ссылка на карту сайта в robots.txt сообщает сканерам, какую структуру URL имеет ваш сайт. Ссылка на карту сайта в robots.txt выглядит так:

Путь к карте сайта вашего домена можно указать в последней строке файла Robots.txt.

Как отправить карту сайта в Google

Чтобы отправить карту сайта в Google, вам нужна ссылка с вашего веб-сайта на Google Search Console. Здесь вы можете отправить свою карту сайта в пункте меню Sitemaps.

Как отправить карту сайта в Google?

На боковой панели Search Console вы найдете пункт меню «Карты сайта».

Отправленные файлы Sitemap можно найти в Google Search Console.

Здесь вы также можете увидеть, отправили ли вы карту сайта и была ли она успешно отправлена ​​или возникли проблемы. Вы также можете легко ввести URL-адрес вашей карты сайта, чтобы она была отправлена.

Карта сайта и отчет о покрытии в GSC.

Список отправленных карт сайта со статусом «Успешно». Вы также можете просмотреть отчет о покрытии индекса.

Ваша карта сайта неверна?

Вы можете узнать в консоли поиска, есть ли ошибки в отправленной вами карте сайта. Это показано в отчете карты сайта в столбце «Статус». Наша карта сайта имеет статус «Успешная». Если ваша карта сайта неверна, то Search Console показывает вам статус «карта сайта содержит ошибки». Если Google не может получить вашу карту сайта, вы увидите это под статусом «Не удалось получить». Вы можете найти список всех возможных кодов ошибок в Справке Google, прокрутив страницу вниз. Здесь вы также получите предлагаемые решения.

Пример правильной отправки карты сайта в Google Search Console.

Регулярно проверяйте этот отчет, чтобы убедиться, что ваши файлы Sitemap по-прежнему не содержат ошибок. Ошибки в карте сайта могут привести к проблемам с индексацией и поэтому должны быть исправлены. В идеале, ваша карта сайта должна создаваться автоматически и уже снизить подверженность ошибкам.

Вам необходимо обновить карту сайта?

Рекомендуется сообщать Google, как только на вашем веб-сайте появляется новый контент. Если ваша карта сайта создается с помощью CMS, карта сайта автоматически обновляется при внесении изменений. Теперь вы понимаете, почему нет смысла создавать карту сайта вручную. Особенно, если новый контент добавляется часто, плагин делает за вас много работы, поэтому вам не нужно беспокоиться об обновлении самостоятельно. Если, с другой стороны, вы создаете свою карту сайта вручную, вам также придется обновлять ее при каждом изменении, и это может быстро привести к путанице.

Динамическая карта сайта — это определение автоматически обновляемых карт сайта, в то время как статические карты сайта означают карту сайта, которая не может обновляться автоматически.

Как обрабатывать несколько языковых версий в XML-карте сайта

Если вы используете несколько языков на своем веб-сайте, вы также должны сообщить об этом Google. Для этого создайте разметку в карте сайта. Есть еще два способа включения атрибута hreflang. Луиза резюмировала, что это такое и что вам еще нужно знать о разных языковых версиях, в своей статье о hreflang.

Чтобы определить языковые версии с помощью карты сайта XML, к элементу loc каждого URL-адреса добавляется элемент XHTML: link , в котором определяются разные языки. Это необходимо сделать для каждого URL-адреса веб-сайта. Это будет выглядеть так:

Как использовать атрибут Hreflang в файлах Sitemap?

С помощью атрибута hreflang вы определяете альтернативные языковые версии в своей карте сайта.

Как видите, все очень быстро становится очень обширным. Поэтому обязательно проверьте свою карту сайта на наличие ошибок, прежде чем отправлять ее в Google. Дополнительную информацию об атрибуте hreflang можно найти непосредственно на странице поддержки Google.

Какие еще существуют типы карт сайта?

В карте сайта, которую я вам представил, перечислены URL-адреса вашего веб-сайта. Если у вас много видеоконтента или изображений или вы хотите, чтобы вас включили в Новости Google, тогда я рекомендую вам также создать соответствующую карту сайта для этого контента?

Файлы Sitemap для видео

С помощью карты сайта для видео вы помогаете Google идентифицировать и находить видео на вашем веб-сайте как таковые. Вы создаете карту сайта для видео с соответствующим расширением в своей CMS.

В настройках Yoast вы найдете пункт «Video SEO», если у вас установлен плагин.

Если вы также используете Yoast для создания карты сайта для видео, то сначала установите плагин «Yoast SEO: Video». Это добавляет еще один пункт меню в настройки Yoast с заголовком «Video SEO».

Вам не нужно ничего делать, чтобы создать карту сайта для видео, Yoast сделает это за вас. Конечно, вы можете указать другие настройки для своих видео, но обычно достаточно настроек по умолчанию.

Как и в случае с обычной картой сайта, вы можете автоматически создать карту сайта для видео с помощью Yoast.

Картинки карты сайта

Также можно включить ваши фотографии в карту сайта. Для изображений (а также для видео или новостей Google) существуют специальные критерии, которые меняются снова и снова. Карта сайта с изображениями не требуется для обычных пользователей веб-сайта, но если у вас большой портал изображений, вы также хотели бы, чтобы вас нашли в поиске изображений. Карта сайта изображения может содержать такую ​​информацию, как субтитры, географическое положение, название или лицензия на изображение.

Файлы Sitemap для Новостей Google

Если у вас есть новостной портал, вполне возможно, что вы также хотели бы быть зарегистрированными в Новостях Google. Во-первых, вам необходимо войти в Новости Google в качестве издателя, чтобы там отображался ваш контент. К карте сайта Новостей Google предъявляются особые требования, о которых вы можете прочитать здесь, в службе поддержки Google. Особенность этого: если ваша карта сайта Google News неисправна, вы вылетаете из Google News до тех пор, пока ошибки не будут исправлены. Поэтому убедитесь, что ваша карта сайта Новостей Google всегда чиста.

Последние мысли о файлах Sitemap как целостном SEO

Файлы Sitemap являются одним из наиболее важных элементов SEO в истории поисковых систем. Это повышает эффективность сканирования и бюджет сканирования, облегчая работу поисковой системы. Наличие категоризированной иерархии Sitemap в структурированном файле индекса Sitemap также может помочь понять иерархию сайта Google или других поисковых систем и взаимосвязь между разделами сайта. Использование индекса Sitemap и нескольких файлов Sitemap в индексе Sitemap может увеличить бюджет сканирования и эффективность. Кроме того, он показывает, какой раздел веб-сайта более важен для пользователей, если индекс карты сайта коррелирует с внутренней структурой ссылок и иерархией сайта. Вероятно, это связано с тем, что по мере роста карты сайта и увеличения количества URL-адресов в ней увеличиваются стоимость и время, необходимое для действий поисковой системы с картой сайта.

У файлов Sitemap есть и другие волшебные стороны. Мы продолжим улучшать наши рекомендации, чтобы улучшить SEO-сообщество.

  • Автор
  • Последние сообщения

Корай Тугберк ГУБЮР

Владелец и основатель Holistic SEO & Digital

Корай Тугберк ГУБЮР является генеральным директором и основателем целостного SEO и цифровых технологий, где он предоставляет SEO-консультации, веб-разработку, науку о данных. , веб-дизайн и услуги по поисковой оптимизации со стратегическим руководством для клиентских проектов агентства по поисковой оптимизации. Koray Tuğberk GÜBÜR регулярно проводит SEO A/B-тесты, чтобы понять Google, Microsoft Bing и Yandex, как алгоритмы поисковых систем и внутреннюю повестку дня. Koray использует науку о данных, чтобы понять пользовательские кривые кликов и деревья решений алгоритмов детских поисковых систем. Тугберк использовал множество веб-сайтов для написания различных тематических исследований SEO. Он опубликовал более 10 тематических исследований SEO с более чем 20 веб-сайтами, чтобы объяснить поисковые системы. Корай Тугберк начал свою карьеру в области SEO в 2015 году в индустрии казино и перешел в индустрию SEO-оптимизации. Koray работал с более чем 700 компаниями над их SEO-проектами с 2015 года. Koray использовал SEO для улучшения взаимодействия с пользователем и коэффициента конверсии, а также узнаваемости бренда онлайн-бизнеса из разных вертикалей, таких как розничная торговля, электронная коммерция, партнерство и b2b.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *