Wed . 19 Aug 2019

Sitemaps

Протокол Sitemaps позволяет веб-мастеру информировать поисковые системы о URL-адресах на веб-сайте, доступных для сканирования. Sitemap - это файл XML, в котором перечислены URL-адреса сайта. Он позволяет веб-мастерам включать дополнительную информацию о каждом URL-адресе: когда он последний раз обновлялся, как часто он меняется и насколько он важен по отношению к другим URL-адресам на сайте. Это позволяет поисковым системам более разумно сканировать сайт. Файлы Sitemap являются протоколом включения URL-адресов и дополняют robotstxt, протокол исключения URL-адресов. Sitemaps особенно полезны для веб-сайты, на которых: - некоторые области веб-сайта недоступны через интерфейс с возможностью просмотра. - веб-мастера используют богатый контент Ajax, Silverlight или Flash, который обычно не обрабатывается поисковыми системами. Сайт очень большой и существует. возможность для веб-сканеров упускать из виду новый или недавно обновленный контент
Когда веб-сайты имеют огромное количество страниц, которые изолированы или плохо связаны друг с другом, или
Когда веб-сайт имеет несколько внешних ссылок
Содержание
1 История
2 Формат файла
21 Определения элементов
3 Другие форматы
31 Текстовый файл
32 Канал синдикации
4 Представление в поисковой системе
41 Ограничения для индексации поисковыми системами
5 Ограничения Sitemap
6 Многоязычные и многонациональные файлы Sitemap
7 См. также
8 Ссылки
9 Внешние ссылки
История
Google впервые представил Sitemaps 084 в июне 2005 года, чтобы веб-разработчики могли публиковать списки ссылок со своих сайтов. Google, MSN и Yahoo объявили о совместной поддержке протокола Sitemaps в ноябре 2006 года. Версия схемы была изменена на «Sitemap 090», но никаких других изменений не было сделано. > В апреле 2007 года Askcom и IBM объявили о поддержке файлов Sitemap. Кроме того, Google, Yahoo, MS объявили об автоматическом обнаружении файлов Sitemap через robotstxt. В мае 2007 года правительства штатов Аризона, Калифорния, Юта и Вирджиния объявили, что будут использовать файлы Sitemap в своих веб-сетях. sites
Протокол Sitemaps основан на идеях [1] из «Удобных для сканирования веб-серверов» [2] w i-е усовершенствования, включая автоматическое обнаружение с помощью robotstxt и возможность указать приоритет и частоту изменения страниц. Формат файла
Формат протокола Sitemap состоит из тегов XML. Сам файл должен быть в кодировке UTF-8. Файлы Sitemap также могут быть просто простой текстовый список URL-адресов. Они также могут быть сжаты в формате gz. Пример файла Sitemap, который содержит только один URL-адрес и использует все необязательные теги, показан ниже. & lt; xml version = "10" encoding = "utf-8 "& gt;
& lt; urlset xmlns =" http: // wwwsitemapsorg / schemas / sitemap / 09 "
xmlns: xsi =" http: // wwww3org / 2001 / XMLSchema-instance "
xsi: schemaLocation = "http: // wwwsitemapsorg / schemas / sitemap / 09 http: // wwwsitemapsorg / schemas / sitemap / 09 / sitemapxsd" & gt;
& lt; url & gt;
& lt; loc & gt; http: // examplecom / & lt ; / loc & lt; lastmod & lt; 2006-11-18 & lt; / lastmod & gt; changefreq & lt; / changefreq & lt; priority & gt; 08 & lt; / priority & gt;
& lt; / url & gt;
& lt; / urlset & gt;
XML-карта Sitemap также расширен для предоставления возможности перечисления нескольких файлов Sitemap в файле «индекс файла Sitemap». Максимальный размер файла Sitemap 50 МБ или 50 000 URL-адресов [3] означает, что это необходимо для больших сайтов. Ниже приведен пример индекса Sitemap со ссылкой на один отдельный файл Sitemap.
& lt; xml version = "10" encoding = "UTF-8" & gt;
& sitemapindex xmlns = "http: // wwwsitemapsorg / schemas / sitemap / 09" & gt;
& lt; sitemap & gt;
& lt; loc & gt; http: // wwwexamplecom / sitemap1xmlgz & lt; / loc & gt;
& lastt & gt; 2014-10-01T18: 23: 17 + 00: 00 & lastt & gt;
& lt; / sitemap & gt;
& lt; / sitemapindex & gt;
Определения элементов
Определения элементов приведены ниже: [3]
Элемент
Обязательный
Описание
& lt; urlset & gt;
Да
Элемент уровня документа для Sitemap Остальная часть документа после '& lt; xml version & gt;' элемент должен содержаться в этом
& lt; url & gt;
Да
Родительский элемент для каждой записи
& lt; sitemapindex & gt;
Да
Элемент уровня документа для индекса Sitemap Остальное документа после "& lt; xml version & gt;" элемент должен содержаться в этом
& lt; sitemap & gt;
Yes
Родительский элемент для каждой записи в индексе
& lt; loc & gt;
Yes
Предоставляет полный URL-адрес страницы или карта сайта, включая протокол, например http, https и завершающий слеш, если этого требует хост-сервер сайта. Это значение должно быть короче, чем 2048 символов. Обратите внимание, что амперсанды в URL должны быть экранированы как & amp;
& lt; lastmod & gt ;
Нет
Дата последнего изменения файла в формате ISO 8601. Может отображать полную дату и время или, при желании, может быть просто датой в формате ГГГГ-ММ-ДД
& lt; changefreq & gt;
Нет
Как часто страница может меняться: всегда, ежечасно, ежедневно, еженедельно, ежемесячно, ежегодно, никогда не ». Всегда »используется для обозначения документов, которые изменяются при каждом обращении к ним.« Никогда »используется для обозначения заархивированных URL-адресов, т. Е. Файлов, которые не будут изменены снова. Это используется только в качестве руководства для сканеров и не используется для определить, как часто страницы индексируются не относится к & lt; карте сайта & gt; elements
& lt; priority & gt;
No
Приоритет этого URL по сравнению с другими URL-адресами на сайте. Это позволяет веб-мастерам предлагать сканерам, какие страницы считаются более важными. Допустимый диапазон - от 00 до 10, при этом 10 является наиболее важным. Значение по умолчанию - 05. Рейтинг всех страниц сайта с высоким приоритетом не влияет на поисковые списки, поскольку он используется только для того, чтобы предложить сканерам, насколько важны страницы на сайте. друг друга
Не относится к & lt; sitemap & gt; элементы
Поддержка элементов, которые не требуются, может варьироваться от одной поисковой системы к другой [3]
Другие форматы
Текстовый файл
Протокол Sitemaps позволяет Sitemap быть простым списком URL-адресов в текстовый файл Спецификации файлов XML Sitemaps применимы и к текстовым файлам Sitemap; файл должен быть в кодировке UTF-8 и не может быть больше 10 МБ или содержать более 50 000 URL-адресов [4], но может быть сжат в виде файла gzip [3]
Фид синдикации
Фид синдикации разрешенный метод отправки URL сканерам; это рекомендуется в основном для сайтов, на которых уже есть каналы синдикации. Один из заявленных недостатков заключается в том, что этот метод может предоставить сканерам только недавно созданные URL-адреса, но другие URL-адреса все еще могут быть обнаружены при обычном сканировании [3]. Может быть полезно иметь Фид синдикации как дельта-обновление, содержащее только новейшее содержимое для дополнения полной карты сайта. - Отправка поисковой системы. - Если файлы Sitemap передаются непосредственно на поисковую систему, они возвращают информацию о состоянии и любые ошибки обработки. Детали, связанные с отправкой. будет отличаться в зависимости от различных поисковых систем. Местоположение карты сайта также может быть включено в файл robotstxt, добавив в robotstxt следующую строку:
Карта сайта: & lt; sitemap_location & gt;
& lt; sitemap_location & gt; должен быть полный URL к карте сайта, такой как: http: // wwwexampleorg / sitemapxml, однако посмотрите обсуждение. Эта директива не зависит от строки user-agent, поэтому не имеет значения, где она находится в файле. веб-сайт имеет несколько файлов Sitemap, в robotstxt может быть включено несколько записей "Sitemap:", или URL-адрес может просто указывать на основной индексный файл карты сайта.
В следующей таблице перечислены URL-адреса отправки карты сайта для нескольких основных поисковых систем:
Поиск engine
Представление URL | Справочная страница
Рынок
Baidu
http: // zhanzhangbaiducom / dashboard / index
Baidu Панель управления для веб-мастеров
Китай, Гонконг, Сингапур
Bing и Yahoo!
http: // wwwbingcom / webmaster / pingaspxsiteMap =
Инструменты Bing для веб-мастеров
Глобальный
Google
http: // wwwgooglecom / webmasters / tools / pingsitemap =
Отправка Карта сайта
Global
Яндекс
http: // webmasteryandexcom / site / mapxml
Файлы файлов Sitemap
Россия, Украина, Беларусь, Казахстан, Турция
URL-адреса карты сайта, представленные с использованием карты сайта submissio n URL-адреса должны быть в кодировке URL-адреса, заменяя: на% 3A, / на% 2F и т. д. [3]
Ограничения для индексации поисковыми системами
Sitemaps дополняют и не заменяют существующие механизмы на основе сканирования, которые используются поисковыми системами уже используется для обнаружения URL. Использование этого протокола не гарантирует, что веб-страницы будут включены в поисковые индексы, и не влияет на то, как страницы ранжируются в результатах поиска. Ниже приведены конкретные примеры. Google - Поддержка веб-мастеров в файлах Sitemap: " Использование карты сайта не гарантирует, что все элементы в вашей карте сайта будут сканироваться и индексироваться, поскольку процессы Google используют сложные алгоритмы для составления расписания сканирования. Однако в большинстве случаев ваш сайт выиграет от наличия карты сайта, и вы никогда не будете быть наказанным за одно "[5]
Bing - Bing использует стандартный протокол sitemapsorg и очень похож на протокол, упомянутый ниже. Yahoo - После того, как поисковая сделка началась между Yahoo! Inc и Microsoft, Yahoo! Site Explorer объединился с инструментами Bing для веб-мастеров
Ограничения Sitemap
Файлы Sitemap имеют ограничение в 50 000 URL-адресов и 50 МБ на карту сайта. Файлы Sitemap можно сжать с помощью gzip, что снижает потребление полосы пропускания. Поддерживается несколько файлов Sitemap, при этом файл индекса Sitemap обслуживает в качестве точки входа Файлы индекса Sitemap могут содержать не более 50 000 файлов Sitemap и не должны превышать 50 МБ 52 428 800 байт и могут быть сжаты. Вы можете иметь более одного файла индекса Sitemap [3]
Как и во всех файлах XML, любые данные значения, включая URL-адреса, должны использовать escape-коды объекта для символов ampersand & amp ;, одинарная кавычка ', двойная кавычка', меньше чем & lt; и больше чем & gt;
Многоязычные и многонациональные файлы Sitemap
В декабре 2011 года Google анонсировал аннотации для сайтов, которые хотят ориентироваться на пользователей на многих языках и, возможно, на страны. Несколько месяцев спустя Google объявила в своем официальном блоге [6], что они добавляют поддержку для указания аннотаций rel = "alternate" и hreflang i n Sitemaps Вместо элементов HTML-ссылок только до тех пор опция Sitemaps предлагала много преимуществ, в том числе меньший размер страницы и более простое развертывание для некоторых веб-сайтов. Один из примеров многоязычного Sitemap будет следующим:
Если, например, мы иметь сайт, предназначенный для пользователей на английском языке через http: // wwwexamplecom / en и пользователей на греческом языке через http: // wwwexamplecom / gr, до тех пор единственным вариантом было добавить аннотацию hreflang в заголовке HTTP или в виде элементов HTML. на обоих URL-адресах, подобных этому, & lt; link rel = "alternate" hreflang = "en" href = "http: // wwwexamplecom / en" & gt;
& lt; link rel = "alternate" hreflang = "gr" href = "http: // wwwexamplecom / gr" & gt;
Но теперь можно альтернативно использовать следующую эквивалентную разметку в файлах Sitemap:
1 & lt; url & gt;
2 & lt; loc & gt; http: // wwwexamplecom / en & lt; / loc & gt;
3 & lt; xhtml: link
4 rel = "alternate"
5 hreflang = "gr"
6 href = "http: // wwwexamplecom / gr" / & gt;
7 & lt; xhtml: link
8 rel = "alternate"
9 hreflang = "en"
10 href = "http: // wwwexamplecom / en" / & gt;
11 & lt; / url & gt;
12 & lt; url & gt;
13 & lt; loc & gt; http: // wwwexamplecom / gr & lt; / loc & gt;
14 & lt; xhtml: ссылка
15 rel = "alternate"
16 hreflang = "gr"
17 href = "http: // wwwexamplecom / gr" / & gt;
18 & lt; xhtml: link
19 rel = "alternate"
20 hreflang = "en"
21 href = "http: // wwwexamplecom / en" / & gt;
22 & lt; / url & gt;
См. также биосайт карты
метаданные
ресурсы ресурса
Yahoo ! Обозреватель сайта - Инструменты Google для веб-мастеров
Ссылки
^ ML Nelson; Дж. А. Смит; дель Кампо; H Ван де Сомпель; X Liu 2006 «Эффективное, автоматизированное использование веб-ресурсов» PDF WIDM'06
^ O Брэндман, Дж. Чо, Гектор Гарсия-Молина и Нараянан Шивакумар 2000 «Веб-серверы, удобные для гусеничных машин» Материалы ACM SIGMETRICS: оценка эффективности, том 28, выпуск 2 doi: 101145/362883362894 CS1 maint: множественные имена: ссылка на список авторов
^ abcdefg "Sitemaps XML format" Sitemapsorg 2016-11-21 Получено 2016-12-01
^ http: // supportgooglecom / webmasters / bin / answerpyhl = ru & amp = answer = 183668
^ "О Google Sitemaps" Googlecom 2016-12-01 Получено 2016-12-01
^ "Многоязычные и многонациональные аннотации сайтов в Sitemaps" Центральный блог для веб-мастеров Google Пьер 24 мая 2012 г.
Внешние ссылки
Официальный сайт
«Основные поисковые системы объединяются для поддержки общего механизма подачи веб-сайтов» Google, 16 ноября 2006 г. - Группы новостей Google - Sitemaps заархивированы
Справка для веб-мастеров - Карта сайта - Традиционный образец карты сайта - v
e
Google
Обзор
Alphabet Inc
История
L Слияния и поглощения


Критика
Вопросы конфиденциальности
Цензура
Домены
Пасхальные яйца
Не будь злым
Реклама
AdMob
Adscape
AdSense
AdWords
Аналитика
Авторы
Партнеры
DoubleClick
DoubleClick for Publishers
Кошелек
Связь
Allo
Оповещения
Приложения Script
Duo
Календарь
Контакты
Gmail
история
интерфейс
Google+
Группы
видеовстречи
Входящие
Синхронизация
Текст -T-Speech - Переводчик - Транслитерация - Голосовая связь - Программное обеспечение - Ассистент
Chrome
для Android
для iOS
Интернет-магазин Chrome
Приложения
Расширения
Облачная печать
Земля
Небо
Луна
Марс
Гаджеты
Gboard
Очки
IME
Пиньинь
Японский
Фотографии
Keep
Новости & amp; Погода
сейчас
OpenRefine
Поиск
Панель инструментов
Платформы
Аккаунт
Android
история версий
разработка программного обеспечения
Android Auto
Android Pay
Android TV - Android Wear - Аутентификатор
Кузов
Книги
Библиотечный проект
Caja
Картон
Литой
Chromecast
Chrome OS
Chromebit
Chromebook
Chromebox
Chrome Zone
Облачная платформа
Платформа приложений
BigQuery
BigTable
Вычислительный движок
Хранение
Контактные линзы
Пользовательские Поиск
Дартс
Мечты о Земле Двигатель
Fit
GFS
Стекло
Go
G Suite
Классная комната
Домой
Jamboard
Торговая площадка
Собственный клиент
Nexus
OnHub
OpenSocial
Pixel
Play
Книги
Игры
Фильмы и фильмы; ТВ, музыка, газетный киоск, общедоступный DNS, кошелек, Wifi, инструменты для разработки, API-интерфейсы AJAX, приложение Inventor, средства закрытия, разработчики
GData
Googlebot
Guava
Guice
GWS
KML
Kythe
MapReduce
Mediabot
Sitemap - Лето кода - Web Toolkit Консоль поиска - Оптимизатор веб-сайта - Swiffy - Публикация
Blogger - Закладки - Диск - Документы, листы, слайды, формы - Чертежи - Мои карты
Fusion Tables - Домены
FeedBurner - Map Maker - Panoramio - Сайты - YouTube - YouTube Instant - YouTube Red - Vevo
Zagat
Поиск по шкале времени - Appliance
Поиск по блогам
Книги
Ngram Viewer
Пользовательский поиск
Финансы
Полеты
Изображения
Карты
Марс
> Луна
Небо
Просмотр улиц
Покрытие
Конкурс
Вопросы конфиденциальности
Новости
Архив
Патенты
Публичные данные
Академия
Покупки
Usenet
Видео
Алгоритмы
PageRank
Panda
Пингвин
Колибри - Возможности - История веб-поиска - Персонализированные - В реальном времени - Мгновенно высушивать ch
SafeSearch - Голосовой поиск - Анализ - Статистика для поиска - Тенденции - График знаний - Хранилище знаний - Прекращено - Aardvark - Ответы
Браузер Синхронизация
База
Buzz
Оформление заказа - Хромированная рамка - Click-to-Call - Cloud Connect - Поиск кода - Потоки
Рабочий стол
Словарь
Dodgeball - Fast Flip - Friend Connect - Gears - GOOG-411 - Google TV, Jaiku, Knol, Здоровье, iGoogle
Image Labeler - Лаборатории - Широта - Lively - Mashup Editor - Блокнот - Предложения - Пакет Orkut - Создатель страниц - Picasa - Веб-альбомы Picasa
Picnik
PowerMeter
Q & amp; A
Reader, Script Converter, SearchWiki, Sidewiki, Слайд, Квадрат, Обсуждение, Обновление, Urchin, Видео, Wave, Web. Ускоритель
Люди
Аль Гор - Алан Юстас, Алан Мулалли, Амит Сингхол, Энн Мазер, Дэвид Драммонд, Эрик Шмидт, Джефф Дин, Джон Доерр
Джон Л Хеннесси, Кришна Бхарат, Мэтт Каттс, Патрик Пичетт, Пол Отеллини, Омид Кордестани, Рэйчел Уитстон, Раджен Шет, Рам Шрайрам, Рэй Курцвейл
Рут Порат
Салар Камангар
Ширли М Тилгман
Сундар Пичай
Сьюзан Войчицки
Урс Хёльцле
Винт Серф
Учредители
Ларри Пейдж
Сергей Brin - Прочее
Арт-проект
Calico
Актуальные
Chrome Experifts
Code-in
Code Jam - День разработчика - Бизнес-группы Google - Сделано с Код
Освобождение данных
Takeout - Google Developer Expert - Google для работы - Автомобиль без водителя - Earth Outreach - Fiber - GV - Google Китай - Google Express
Googlization
Гранты
Googleorg
Лунный X Приз
Проект Fi
Material Design - Motorola Mobility - WiFi - X - События - Научная ярмарка - Поиск - I / O - День разработчика - AtGoogleTalks
Код Jam
Открытое соревнование с участием участников
Code-in
Проекты
Ara
Loon
Tango
Люк на крыше
Недвижимость
111 Восьмая авеню
Googleplex
Logo
Doodle4Google
Google Doodles
Связанные
AI Challenge
Бомба
Goojje
Улицы монопольного города
Единство
Категория
Портал


Sitemaps

Random Posts

Picts

Picts

The Picts were a tribal confederation of peoples who lived in what is today eastern and northern Sco...
Visual prosthesis

Visual prosthesis

A visual prosthesis, often referred to as a bionic eye, is an experimental visual device intended to...
Mini rugby

Mini rugby

Mini rugby, also known as New Image Rugby, is a form of rugby union designed to introduce the sport ...
List of synthetic polymers

List of synthetic polymers

Synthetic polymers are human-made polymers From the utility point of view they can be classified int...

Random Posts (searchxengine.com)

Wargame

Wargame

Wargame (from the English. "Wargame" - Russian. "War game") - a kind of strategi
Troitsky District (Altai Territory)

Troitsky District (Altai Territory)

Russia Russia Status Municipal district Included in the Altai Territory and the Administrative Ce
Russian evangelism

Russian evangelism

Evangelical Christians - a movement of Protestant Christianity, close to Baptism according to a numb
Apartment zero

Apartment zero

Thriller Drama Director Martin Donovan Producer Martin Donovan David Kepp Screenwriter Marti