Interested Article - Sitemaps
- 2020-03-14
- 2
Sitemaps
—
XML
-файлы с информацией для
поисковых систем
(таких как
Google
,
Bing
,
Яндекс
) о страницах
веб-сайта
, которые подлежат
индексации
. Sitemaps могут помочь поисковикам определить местонахождение страниц сайта, время их последнего обновления, частоту обновления и важность относительно других страниц сайта для того, чтобы
поисковая машина
смогла более разумно индексировать сайт.
Использование
протокола
Sitemaps не является гарантией того, что веб-страницы будут проиндексированы поисковыми системами, это всего лишь дополнительная подсказка для сканеров, которые смогут выполнить более тщательное сканирование сайта.
Формат протокола Sitemap
Формат протокола Sitemap состоит из XML-тегов. В файле необходимо использовать кодировку UTF-8 .
Пример XML-файла Sitemap
Ниже приведен пример файла Sitemap, в котором содержится только один URL-адрес и использованы все необязательные теги.
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="https://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://example.com/</loc>
<lastmod>2013-11-18</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>
Использование файлов индекса Sitemap
Можно предоставить несколько файлов Sitemap, однако в каждом из этих файлов должно быть не более 50000 URL, а размер каждого из этих файлов не должен превышать 50 МБ. При необходимости файл Sitemap можно сжать с помощью архиватора
gzip
, чтобы его размер не превышал 50 МБ, и тем самым уменьшить требования к пропускной способности канала.
Если необходимо перечислить более 50000 URL, следует создать несколько файлов Sitemap, при этом необходимо перечислить каждый из этих файлов в
файле индекса Sitemap
(
Sitemap index
). Формат файла индекса Sitemap похож на формат файла Sitemap.
Подробная информация об использовании файлов индекса Sitemap на официальном сайте: .
Другие форматы файла Sitemap
- Канал синдикации ( RSS 2.0, а также Atom 0.3 или 1.0)
- Текстовый файл (в текстовом файле в каждой строке должен быть только один URL)
Местоположение файла Sitemap
Рекомендуется располагать файл Sitemap в корневом каталоге сервера, чтобы ссылка выглядела примерно так: 25 января 2012 года. .
-
Все ссылки, перечисленные в файле Sitemap, должны находиться в том же
домене
, что и сам Sitemap.
- Например, если файл Sitemap находится по адресу 25 января 2012 года. , то он не может включать в себя ссылки страниц с доменов (недоступная ссылка) или .
-
Ссылки в файле Sitemap должны указывать на страницы, находящиеся в том же каталоге (или его подкаталогах), что и сам файл Sitemap.
- Например, если файл Sitemap находится на (недоступная ссылка) , то он не может включать в себя ссылки на страницы (недоступная ссылка) или (недоступная ссылка) .
-
Ссылки, указанные в файле Sitemap, должны использовать тот же протокол (например,
HTTP
), по которому доступен файл Sitemap.
- Это значит, что если файл Sitemap находится на 25 января 2012 года. , то он не может содержать ссылки типа (недоступная ссылка) и (недоступная ссылка) .
Проверка файла Sitemap
Для определения элементов и атрибутов, которые могут появляться в файлах Sitemap, используются следующие XML-схемы:
- Для файлов Sitemap:
- Для файлов индекса Sitemap:
Уведомления для сканеров поисковых систем
После того, как файл Sitemap создан и размещен на веб-сервере, необходимо сообщить о местонахождении этого файла поисковым системам, поддерживающим этот протокол. Это можно сделать следующим образом:
- с помощью интерфейса поисковой системы
- указав местоположение файла Sitemap в файле robots.txt
- выслав HTTP-запрос
Затем поисковые системы смогут извлечь файл Sitemap и разрешить своим сканерам доступ к URL-адресам.
Использование файла robots.txt
Чтобы сообщить поисковым системам местоположение файла Sitemap, можно в robots.txt добавить строку вида:
Sitemap: <sitemap_location>
Где <sitemap_location> — полный URL файла Sitemap, например: www.site.ru/sitemap.xml .
Использование HTTP-запроса
Можно указать поисковым системам местонахождение файла Sitemap при помощи HTTP-запроса, используя таблицу:
Поисковая система | Адрес | Описание |
---|---|---|
https://google.com/ping?sitemap=<sitemap_location> | ||
Bing | https://www.bing.com/ping?sitemap=<sitemap_location> |
, где <sitemap_location> необходимо заменить на полный URL файла Sitemap.
Например, чтобы добавить файл
25 января 2012 года.
в поисковик Google, нужно отправить HTTP-запрос:
https://google.com/ping?sitemap=
http://www.example.com/sitemap.xml
Примечания
- . Дата обращения: 22 сентября 2007. 2 января 2011 года.
Ссылки
- (рус.) (создан при поддержке Google, Yahoo, Microsoft)
- (англ.)
- 2020-03-14
- 2