Обсудим ваш проект?
Обсудите ваш проект с экспертом SEO
Вам ответит руководитель Result Plus - Садовничий Сергей
Telegram
WhatsApp
Viber
Messenger
Skype
Mail
Phone

КАРТА САЙТА SITEMAP XML: СОЗДАНИЕ, НАСТРОЙКА, ГЕНЕРАЦИЯ

Карта сайта Sitemap.xml

XML-карта сайта, или Sitemap — это специальный файл, в котором перечислены URL страниц, доступных для индексации роботами поисковых систем. С его помощью можно:
  • перечислить местонахождение всех индексируемых страниц сайта;
  • указать дату и время с момента внесения последних изменений на странице;
  • приоритетность индексации страниц;
  • частоту обновлений для каждой страницы.
Стоит отметить, что инструкции и ссылки в файле не несут обязательное условия их выполнения, а лишь позволяют поисковым системам более качественно индексировать сайт.
Роботы поисковых систем корректно обрабатывают текстовый формат .txt в кодировке UTF-8 и файл по XML-протоколу. В первом случае достаточно перечислить необходимые URL-адреса списком в теле файла без каких либо дополнительных тегов. Как правило, Sitemap находится в корневой директории сайта, однако есть исключения (об этом ниже).

Когда нужен Sitemap xml для сайта?

Мы рекомендуем корректно заполнять файл сайтмап в любых ситуациях. Однако есть случаи когда наличие правильной XML-карты жизненно важно для успеха проекта:
  1. Глубокая вложенность страниц.
  2. Наличие посадочных страниц, недоступных через пользовательскую навигацию. Другими словами, если на страницу не ведет ни одна внутренняя ссылка, то вероятность индексации её крайне мала.
  3. Использование технологий, которые усложняют индексацию поисковыми системами (Ajax, JavaScript, Silverlight, Flash).
  4. Большое число страниц сайта.

Настройка Sitemap.xml

Для Sitemap существует ряд обязательных и необязательных тегов. Все они являются парными, т.е. требуют наличие закрывающего тега в конце. К обязательным относятся:
<urlset> — указывает на стандарт используемого протокола, преимущественно используется Sitemap 0.90. Тег ставится в начале документа.
<url> — родительский тег для каждой страницы, в котором перечислены все элементы, которые касаются конкретной страницы. Должен содержать только один URL-адрес.
<loc> — тут указываем полный путь к странице сайта в абсолютном виде (с указанием протокола и доменного имени).
Необязательные элементы (теги) сайтмап:
<lastmod> — необходим для указания даты и времени последнего изменения страницы.
<changefreq> — насколько часто страница может обновляться. Возможные параметры: always, hourly, daily, weekly, monthly, yearly, never.
<priority> — указывает на приоритетность индексации страниц. Максимальное значение 1.0. При отсутствии данного тега всем страницам присваивается priority = 0.5. Не поддерживается Google.

Поисковая система Google поддерживает более широкий список тегов в XML-картах. Дополнительно к перечню страниц, можно создать карту сайта для фото, видео и новостного контента для более корректной обработки и индексации.
пример карты сайта sitemap.xml
Пример карты сайта sitemap.xml

Sitemap для картинок

Использование сайтмап для фото-контента позволит поисковому боту обнаружить недоступный при обычном краулеринге контент, например вывод фотографий в результате отработки JavaScript

Sitemap для видео

Обладателям уникального видеоконтента рекомендуется задуматься о создании отдельной карты сайта для видео. С её помощью можно управлять отображением ваших видеороликов в результатах поиска по видео, а также помочь поисковому роботу качественно обработать ролики.

Sitemap Для Google News

Настоятельно рекомендуется к созданию для новостных сайтов, которые зарегистрированы в сервисе Google Новости. Само наличие отдельного Sitemap не гарантирует высоких позиций, однако позволит передавать поисковому роботу дополнительную информацию по каждой новости.
Ограничения:
1. Не более 1000 УРЛ для 1-й карты сайта
2. Новостная карта сайта должна содержать ссылки на новости за последние 2 дня. Остальные рекомендуется своевременно удалять.

Технические требования и ограничения

  • Созданный файл sitemap.xml необходимо размещать в корневой директории вашего сайта, по аналогии с файлом robots.txt.
  • Файл сайтмап должен иметь то же доменное имя и протокол, что и перечисленные в нем URL-адреса
  • Допускается создание отдельного Sitemap для раздела сайта. В таком случае сам файл должен физически находиться в корневой папке раздела.
  • Каждый поддомен должен иметь свой файл sitemap.xml.
  • Использовать только абсолютные URL-адреса страниц.
  • Спецсимволы необходимо конвертировать в HTML-формат:
  • Код ответа сервера для перечисленных URL-адресов должен отдавать 200 OK.
  • Максимальный размер файла 10 MB для Яндекс и 50 MB для Google.
  • Максимальная число символов для УРЛ в файле 1024 для Яндекс и 2048 для Google.
  • Максимальное число URL - 50 тыс.
  • Исключить дублирование URL-адресов в карте сайта
  • Допускается использование кириллических адресов для Яндекс. Для Google URL необходимо преобразовать в Punycode.
  • Перечень страниц сайта должен быть открыт к индексации поисковыми роботами (не закрыты в файле robots.txt или через соответствующий <meta name="robots" />).
  • Допускается использование сжатие файла gzip, однако это не снимает ограничение на максимальный размер файла в распакованном виде.
  • Возможно использование RSS, mRSS и Atom 1.0 форматов для ПС Google, Яндекс не поддерживает данные фиды.

Использование кириллических URL

Поисковые системы Google и Яндекс допускают наличие и одинаково обрабатывают кириллические адреса в XML-карте сайта. Однако протокол сайтмап допускает использование только ASCII символов в адресах страниц. Поэтому для корректной индексации прочими поисковыми системами рекомендуется преобразовывать кириллицу в Punycode и использовать маскировку кириллических URL. Простой и удобный сервис для конвертации в Punycode-формат.
Punycode-формат

Как использовать несколько карт сайта?

Существует ряд случаев, когда необходимо использовать несколько файлов Sitemap:
  • Количество УРЛ-адресов превышает 50 тыс. строк.
  • Использование нескольких CMS на одном сайте.
  • Созданы отдельные карты сайта для разных разделов.
  • Особенность работы установленного плагина.
  • Удобство для отслеживания ошибок по рубрикам/разделам.

В таком случае все отдельные Sitemap объединяются в один индексный со следующими тегами:
  1. <sitemapindex> — как и <urlset>, указывает на стандарт используемого протокола.
  2. <sitemap> — по аналогии с <url>, родительский тег для каждой отдельной карты сайта
  3. <loc> — абсолютный путь к расположению сайтмап раздела.
  4. <lastmod> — дата и время последнего изменения файла Sitemap.

Способы создания Sitemap

Существуют несколько способов создания файла sitemap.xml, которые следует использовать в зависимости от особенностей сайта. Каждый из них имеет свои положительные и отрицательные стороны. Специалисты Google подготовили развернутый список способов и решений для генерации корректной XML-карты сайта для разных случаев. На некоторых остановимся более подробно.

Генерация карты сайта sitemap.xml онлайн

XML Sitemap Generator как правило полностью покрывает потребность пользователя. Имеет ограничение в 2000 URL на Free-тарифе.
xmlsitemapgenerator
XML-Sitemaps.com еще один популярный онлайн-генератор Sitemap. Можно бесплатно сгенерировать до 500 адресов. Идеально подходит для небольших сайтов.
XML-Sitemaps
Check Domains не имеет ограничений и полностью бесплатен, однако достаточно нестабилен при обработке большого числа страниц.
Check Domains

Десктопные версии Генерация сайтмап

Краулер Screaming Frog SEO Spider после парсинга сайта позволяет в несколько кликов получить готовую карту сайта
Screaming Frog SEO Spider для сайтмап
Краулер Netpeak Spider является отечественным аналогом СкриминФрог, также после сбора всех URL-адресов позволяет в несколько кликов скачать готовый к заливке на сайт файл sitemap.xml.
Netpeak Spider

Плагины для CMS WordPress

WordPress является самой распространенной ЦМС в мире, поэтому создано множество плагинов для генерации Sitemap прямо на сайте в онлайн режиме. Особое внимание следует уделить следующим плагинам:
Yoast SEO
Google XML Sitemaps
WP Sitemap Page

Карта сайта для мультиязычных и мультирегиональных сайтов

ПС Google предусматривает передачу разметки hreflang прямо в файле Sitemap. Для этого необходимо указать специальный тег <xhtml:link>, внутрь которого помещаются атрибуты:
  • rel="alternate";
  • hreflang="ХХ", где указывается локализация страницы;
  • href="ХХ" ссылка на локализованную версию страницы.
В случае двуязычной версии сайта (РУС/УКР) сайтмап будет выглядеть следующим образом:

Переход на HTTPS протокол

При переходе на защищенный SSl-сертификат необходимо перенастроить генерацию файла sitemap.xml:
  • убедиться, что новый файл доступен по HTTPS-протоколу;
  • настроить 301 редирект с HTTP на HTTPS версию карты сайта;
  • убедиться, что в новый файл попадают страницы c HTTPS-протоколом, и они все отдают код ответа 200 OK;
  • сменить протокол сайтамп в файле robots.txt;
  • заменить ссылки на Sitemap в вебмастерских.

Как добавить сайтмап в Яндекс Вебмастер?

Для добавления ссылки на рабочий файл sitemap.xml в Яндекс Вебмастер необходимо:

1. В разделе Индексирование зайти в подраздел Файлы Sitemap
сайтмап в яндекс вебмастер
2. Вставить полный путь к файлу в соответствующее поле и нажать кнопку Добавить.
добавление sitemap в вебмастер яндекс
Если нет никаких проблем, после проверки файла в колонке Статус будет отображаться Ок. Тут же находится кнопка в виде круглой стрелки, которая позволит отправить файл сайтмап на переобход.

Как добавить сайтмап в Google Search Console?

Для добавления ссылки на Sitemap в панель Google Search Console необходимо:
1. В разделе Индекс перейти в подраздел Файлы Sitemap.
2. Указать относительный путь к файлу в поле Добавьте файл Sitemap и нажать кнопку Отправить.
добавить сайтмап в google search console

Как найти ошибки в sitemap.xml?

Вебмастерские поисковых систем позволяют произвести проверку и отладку работы файла sitemap.xml
Для проверки в Яндекс Вебмастере необходимо:
1. В разделе Инструменты перейти в подраздел Анализ файлов Sitemap.
проверка ошибок sitemap.xml
2. Указать путь к файлу sitemap.xml на сайте, скопировать содержимое сайтмап в текстовое поле либо загрузить сохраненный файл с вашего устройства.
анализ файлов сайтмап
анализ sitemap
3. Нажать кнопку Проверить
После проверки на странице отобразятся все выявленные ошибки, или появится уведомление об их отсутствии.
Проверка карты сайта в Google Search Console более невозможно, т.к. поисковик убрал данный функционал для новой версии вебмастерской. Однако в скором будущем возможно появление инструмента проверки с значительно расширенными возможностями.
ЭФФЕКТИВНО ПРОДВИГАЕМ САЙТЫ!
ОБРАЩАЙТЕСЬ!

Выберите удобный способ связи:

Телефон / Email / WhatsApp / Telegram / Viber


Или заполните форму заявки ниже

Немного рекламы
Наши публикации
Показать еще