Карта сайта представляет собой список страниц сайта для поисковых систем или пользователей и аналогична разделу Содержание обычной книги.
Используется как элемент навигации, показывает взаимосвязь между страницами сайта.
Таким образом, xml-карта сайта это файл с информацией для поисковых систем о страницах, которые необходимо проиндексировать. Другими словами, карта сайта — список всех страниц в формате XML, доступных для сканирования поисковым роботом. При этом стоит отличать XML-карту от обычной карты сайта, которая находится по адресу http://example.com/sitemap/. С ее помощью определяется:
- местонахождение страниц сайта;
- время последнего обновления каждой из страниц;
- частота (периодичность) обновления и важность относительно других страниц сайта;
- важность (приоритетность) страниц в структуре.
Пример XML-файла Sitemap
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.com/</loc>
<lastmod>2021-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>
Определения XML-тегов:
- sitemapindex — родительский тег в начале и конце файла;
- sitemap — родительский тег для каждого файла sitemap, указанного в файле. При этом данный тег — дочерний относительно sitemapindex;
- url — блок, который содержит значение самого URL и прочие элементы;
- loc — непосредственно URL страницы;
- changefreq — как часто данная страница может изменяться. Возможные значения: always, hourly, daily, weekly, monthly, yearly, never;
- priority — приоритет структурных элементов, помогает определить, какие страницы более приоритетные для краулинга. Ему присваивается значение до единицы, например: 0,5.
- lastmod — время последнего обновления контента страницы, не обязательный параметр. Для сайтов со статическим контентом достаточно использовать changfreq.
Внедрение XML-карты
- Файл с XML sitemap следует поместить в корневую директиву сайта: http://<адрес сайта>/sitemap.xml.
- Если карт сайта несколько, необходимо создать индекс карт, где должны быть перечислены ссылки на все XML-файлы.
- Добавить директиву sitemap в файл robots.txt.
- Указать URL файла в панелях вебмастеров интересующих поисковых систем, например:
- Google Search Console;
- Яндекс.Вебмастер;
- Кабинет вебмастера MailRu.
Файлы sitemap учитываются при индексировании сайта роботом, однако ни одна из поисковых систем не гарантирует, что все URL, указанные в файле, будут добавлены в поисковый индекс.
Рекомендации Яндекса
Яндекс поддерживает два формата файлов sitemap:
- XML (рекомендуется);
- текстовый файл.
Требования для карт Яндекс:
- размер в несжатом виде не должен превышать 10 Мб;
- Яндекс распознает Punycode (пуникод) как в закодированном виде, так и в оригинале.
Рекомендации Google
Принципиально:
- до 50 000 ссылок на файлы sitemap;
- общий размер до 50 Мб (в несжатом виде).
Форматы, которые поддерживает Google в качестве sitemap:
- XML — стандартный файл;
- RSS, media RSS и Atom 1.0 — подходит для блогов с фидом RSS или Atom;
- Сайты Google. Если сайт создан и подтвержден с помощью сервиса «Google Сайты», файл sitemap создается автоматически. Его нельзя изменить, но можно отправить в Google, чтобы получать сведения для отчетов. Если в одном подкаталоге содержится более 1000 страниц, файл sitemap может отображаться некорректно.
- Текстовый файл .txt.
Основные требования к текстовым файлам:
- кодировка UTF-8;
- файл не должен содержать ничего, кроме списка URL;
- текстовому файлу можно дать любое имя, но только с расширением .txt (например, sitemap.txt).
Если у Вас появились дополнительные вопросы, вы всегда можете обращаться в нашу службу поддержки через систему тикетов.