Wed . 19 Nov 2019

Мапи сайту

Протокол Sitemaps дозволяє веб-майстру інформувати пошукові системи про URL-адреси на веб-сайті, доступні для сканування. Sitemap - це файл XML, у якому перераховані URL-адреси веб-сайту. Він дозволяє веб-майстрам включати додаткову інформацію про кожну URL-адресу: коли вона востаннє оновлена, як часто він змінюється і наскільки це важливо стосовно інших URL-адрес на веб-сайті. Це дозволяє пошуковим системам більш інтелектуально сканувати сайт. Sitemap - це протокол включення URL-адреси та доповнення robotstxt, протокол виключення URL-адрес. веб-сайти, де: деякі ділянки веб-сайту недоступні через інтерфейс для перегляду. Вебмайстри використовують багатий вміст Ajax, Silverlight або Flash, який зазвичай не обробляється пошуковими системами. Сайт дуже великий і є шанс веб-сканерам не помітити деякий новий або нещодавно оновлений вміст. Коли веб-сайти мають величезну кількість сторінок, які відокремлені або не добре пов’язані між собою, або
Коли веб-сайт має мало зовнішніх посилань - Зміст - 1 Історія - 2 Формат файлу - 21 Визначення елементів - 3 Інші формати - 31 Текстовий файл - 32 Синдикаційний канал - 4 Подання пошукової системи
41 Обмеження для індексації пошукової системи - 5 лімітів мапи сайту - 6 Багатомовні та багатонаціональні карти сайтів - 7 Дивіться також 8 посилань - 9 Зовнішні посилання - Історія - Google вперше представив мапи сайту 084 в червні 2005 року, щоб веб-розробники могли публікувати списки посилань на своїх сайтах Google, MSN та Yahoo оголосили про спільну підтримку протоколу Sitemaps у листопаді 2006 р. Версія схеми була змінена на "Sitemap 090", але інших змін
У квітні 2007 року Askcom та IBM оголосили про підтримку Sitemaps Також Google, Yahoo, MS оголосили про автоматичне відкриття мапи сайту через робочий стіл У травні 2007 року уряди штатів Арізони, Каліфорнії, Юти та Вірджинії оголосили, що будуть використовувати сайти у своїй мережі сайти
Протокол Sitemaps базується на ідеях [1] від "Веб-сервери, зручні для сканування" [2] w удосконалення, включаючи автоматичне відкриття через roboststxt та можливість вказувати пріоритет та частоту змін сторінок
Формат файлу
Формат протоколу Sitemap складається з тегів XML Сам файл повинен бути кодованим UTF-8, мапи сайту також можуть бути просто простий текстовий список URL-адрес Вони також можуть бути стислі у форматі gz. Зразковий файл Sitemap, який містить лише одну URL-адресу та використовує всі необов’язкові теги, показаний нижче. & lt; urlset xmlns =" http: // wwwsitemapsorg / schemas / sitemap / 09 "
xmlns: xsi =" http: // wwww3org / 2001 / XMLSchema-instance "
xsi: schemaLocation = "http: // wwwsitemapsorg / schemas / sitemap / 09 http: // wwwsitemapsorg / schemas / sitemap / 09 / sitemapxsd" & gt;
& lt; url & gt;
& lt; loc & gt; http: // examplecom / & lt ; / loc & gt;
& lt; lastmod & gt; 2006-11-18 & lt; / lastmod & gt;
щодня & lt; / changefreq> gt & пріоритет> 08 & lt; / пріоритет & gt;
& lt; / url & gt;
& lt; / urlset & gt;
XML-протокол Sitemap також розширено, щоб запропонувати спосіб перерахування декількох мап сайту у файлі "Індекс Sitemap". Максимальний розмір Sitemap 50MiB або 50 000 URL-адрес [3] означає, що це необхідно для великих сайтів. Наведений приклад індексу Sitemap, що посилається на один окремий файл Sitemap
& lt; xml версія = "10" encoding = "UTF-8"> gt; & lt; sitemapindex xmlns = "http: // wwwsitemapsorg / schemas / sitemap / 09" & gt;
& lt; sitemap & gt;
& lt; loc & http; // wwwexamplecom / sitemap1xmlgz & lt; / loc & gt;
& lt; lastmod & gt; 2014-10-01T18: 23: 17 + 00: 00 & lt; / lastmod & gt;
& lt; / sitemap & gt;
& lt; / sitemapindex & gt;
Визначення елементів. Визначення елементів наведено нижче: [3]
Елемент | Обов'язковий | Опис | & lt; urlset & gt;
Так - Елемент рівня документа для Sitemap Решта документа після ' Так
Елемент рівня документа для індексу Sitemap Решта документа після "& lt; xml-версії & gt;" елемент повинен міститись у цьому & lt; sitemap & gt; так. Так, батьківський елемент для кожного запису в індексі
& lt; loc & gt; Так Так, надає повну URL-адресу сторінки або sitemap, включаючи протокол, наприклад, http, https та косою косою рисою, якщо цього вимагає сервер хостингу сайту. Це значення повинно бути коротшим 2,048 символів. Зверніть увагу, що амперсанди в URL-адресі потрібно уникати як & amp;
& lt; lastmod & gt ;
Ні | Дата останнього змінення файлу у форматі ISO 8601 Це може відображати повну дату та час або, за бажанням, може бути просто датою у форматі РРРР-MM-DD
& lt; changefreq & gt;
Ні, Як часто сторінка може змінюватися: завжди завжди щогодини - щоденно - щотижня - щомісяця - щомісяця - щорічно - ніколи не " Завжди "використовується для позначення документів, що змінюються щоразу, коли до них звертаються," Ніколи "не використовується для позначення архівованих URL-адрес, тобто файлів, які не будуть змінені знову. Це використовується лише як посібник для сканерів, і не використовується для визначити, наскільки часто індексуються сторінки не застосовується до & sitemap & gt; елементи
& lt; пріоритет & gt; Ні Ні
Пріоритет цієї URL-адреси щодо інших URL-адрес на сайті Це дозволяє веб-майстрам пропонувати сканерам, які сторінки вважаються важливішими. Дійсний діапазон - від 00 до 10, найважливішим є 10, значення за замовчуванням - 05
Рейтинг усіх сторінок на сайті з високим пріоритетом не впливає на пошукові списки, оскільки він використовується лише для підказування сканерам, наскільки важливими сторінками для сайту є один за одним
Не застосовується до & sitemap & gt; елементи
Підтримка елементів, які не потрібні, може змінюватись від однієї пошукової системи до іншої [3]
Інші формати - текстовий файл
Протокол Sitemaps дозволяє простому списку URL-адрес у текстовий файл Технічні характеристики файлів Sitemap XML застосовуються і до текстових мап сайтів; файл повинен бути закодований UTF-8 і не може бути більшим за 10 Мб або містити більше 50 000 URL-адрес [4], але може бути стиснутий як gzip-файл [3]
Синдикаційний канал | дозволений спосіб подання URL-адреси сканерам; це рекомендується в основному для сайтів, які вже мають канали синдикації. Одним із зазначених недоліків є те, що цей метод може надавати сканерам лише нещодавно створені URL-адреси, але інші URL-адреси все одно можуть бути виявлені під час звичайного сканування [3]. Це може бути корисно мати канал синдикації як дельта-оновлення, що містить лише найновіший вміст, який доповнює повну мапу сайту - подання пошукової системи - Якщо мапи сайту подаються безпосередньо в пошукову систему, він поверне інформацію про стан та будь-які помилки обробки. буде залежати від різних пошукових систем Місце розташування мапи сайту також може бути включено у файл robotstxt, додавши наступний рядок до robotstxt:
Sitemap: & lt; sitemap_location & gt;
& lt; sitemap_location & gt; повинна бути повна URL-адреса до карти сайта, наприклад: http: // wwwexampleorg / sitemapxml, однак дивіться обговорення Ця директива не залежить від рядка користувача-агента, тому не має значення, де вона розміщена у файлі. веб-сайт має кілька мап сайту, декілька записів "Sitemap:" можуть бути включені в роботxtxt, або URL може просто вказувати на основний файл індексу мапи сайту. Наступна таблиця перераховує URL-адреси подання Sitemap для кількох основних пошукових систем:
Пошук двигун: URL-адреса подання - Сторінка довідки - Ринок - Baidu
http: // zhanzhangbaiducom / приладова панель / індекс - Інформаційна панель веб-майстрів Baidu в Китаї, Гонконгу, Сінгапурі - Бінг та Yahoo!
http: // wwwbingcom / webmaster / pingaspxsiteMap = - Інструменти для веб-майстрів Bing - Global
Google
http: // wwwgooglecom / webmasters / tools / pingsitemap =
Подання Карта сайту - Глобальний
Яндекс
http: // webmasteryandexcom / site / mapxml - Файли мапи сайтів у Росії, Україні, Білорусі, Казахстані, Туреччині - URL-адреси мапи сайту, подані за допомогою поданої мапи сайту n URL-адреси повинні бути кодовані URL-адресами, замінюючи:% 3A, / з% 2F і т. д. [3]
Обмеження для індексації пошукових систем
Мапи сайту доповнюють і не замінюють існуючі механізми на основі сканування, які шукають пошукові системи вже використовуються для виявлення URL-адрес Використання цього протоколу не гарантує включення веб-сторінок до пошукових індексів, а також не впливає на те, як сторінки розміщуються в результатах пошуку. Конкретні приклади наведені нижче. Google - Підтримка веб-майстрів на сайтах: " Використання мапи сайту не гарантує, що всі елементи вашої мапи сайту будуть сканувати та індексуватись, оскільки процеси Google покладаються на складні алгоритми для планування сканування. Однак у більшості випадків на вашому веб-сайті виграє карта сайту, і ви ніколи не будете зазнають штрафу за наявність одного "[5]
Bing - Бінг використовує стандартний протокол sitemapsorg і дуже схожий на той, що згадується нижче. Yahoo - Після того, як пошукова угода розпочалася між Yahoo! Inc та Microsoft, Yahoo! Провідник сайту об'єднався з Інструментами для веб-майстрів Bing - Обмеження мапи сайту - Файли мапи сайту мають обмеження 50 000 URL-адрес і 50 Мбіб на мапу сайту. Мапи сайту можна стиснути за допомогою gzip, зменшуючи споживання пропускної здатності. Підтримуються кілька файлів мапи сайту, де подається файл індексу Sitemap. як вхідна точка файлів покажчиків мапи сайту не може містити більше 50 000 мап сайтів і не повинна перевищувати 50 Мбіт 52 428 800 байт, і їх можна стиснути. Ви можете мати більше одного файлу індексу Sitemap [3]
Як і у всіх файлах XML, будь-які дані Значення, включаючи URL-адреси, повинні використовувати коди евакуації об'єктів для символів ampersand & amp ;, одна цитата ", подвійна цитата", менше & lt ;, та більше> gt. Багатомовні та багатонаціональні карти сайту
У грудні 2011 року Google оголосила про анотації для веб-сайтів, які хочуть націлювати користувачів на багато мов, і, за бажанням, на країни Через кілька місяців Google оголосив у своєму офіційному блозі [6], що вони додають підтримку для визначення приміток rel = "alternate" та hreflang i n Sitemaps Замість елементів до цього часу лише посилання HTML опція Sitemaps запропонувала багато переваг, які включали менший розмір сторінки та легше розгортання для деяких веб-сайтів. Одним із прикладів багатомовної Sitemap було б дотримання. Якщо, наприклад, ми створити веб-сайт, який орієнтований на користувачів англійської мови через http: // wwwexamplecom / en та користувачів грецької мови через http: // wwwexamplecom / gr, до цього часу єдиним варіантом було додати анотацію hreflang або у заголовку HTTP, або як елементи HTML на обох URL-адресах, подібних до цієї: & lt; link rel = "alternate" hreflang = "en" href = "http: // wwwexamplecom / en" & gt;
& lt; link rel = "alternate" hreflang = "gr" href = "http: // wwwexamplecom / gr" & gt;
Але тепер можна альтернативно використовувати таку еквівалентну розмітку в Sitemap:
1 & ur; gt; 2 2 & lt; loc & gt; http: // wwwexamplecom / en & lt; / loc & gt;
3 & lt; xhtml: посилання - 4 rel = "альтернативний" - 5 hreflang = "gr" - 6 href = "http: // wwwexamplecom / gr" / & gt;
7 & lt; xhtml: link - 8 rel = "alternate" - 9 hreflang = "en"
10 href = "http: // wwwexamplecom / en" / & gt;
11 & lt; / url & gt;
12 & lt; url & gt; 13 13 & lt; loc & http: // wwwexamplecom / gr & lt; / loc & gt;
14 & lt; xhtml: посилання - 15 rel = "альтернативний" - 16 hreflang = "gr" - 17 href = "http: // wwwexamplecom / gr" / & gt;
18 & lt; xhtml: link
19 rel = "альтернативний" - 20 hreflang = "en"
21 href = "http: // wwwexamplecom / en" / & gt;
22 & lt; / url & gt;
Див. також Біосистема - Метадані - Ресурси ресурсу - Yahoo ! Провідник сайту - Інструменти Google для веб-майстрів - Довідкова інформація - ^ ML Нельсон; Дж. Сміт; дель Кампо; H Van de Sompel; X Liu 2006 "Ефективне, автоматизоване збирання веб-ресурсів" PDF WIDM'06
^ O Brandman, J Cho, Hector Garcia-Molina, Narayanan Shivakumar 2000 "Веб-сервери, що відповідають сканерам" Матеріали огляду оцінки ефективності ACM SIGMETRICS, том 28, випуск 2 doi: 101145/362883362894 CS1 maint: Кілька імен: посилання на список авторів
^ abcdefg "Sitemaps XML-формат" Sitemapsorg 2016-11-21 Отримано 2016-12-01
^ http: // supportgooglecom / webmasters / bin / answerpyhl = en & amp; answer = 183668
^ "Про Google Sitemap" Googlecom 2016-12-01 Отримано 2016-12-01
^ "Багатомовні та багатонаціональні анотації на сайтах у сайтах" Центральний блог веб-майстрів Google Pierre Далеко, 24 травня 2012 р. - Зовнішні посилання - Офіційний веб-сайт - «Основні пошукові системи об'єднуються для підтримки загального механізму подання веб-сайтів» Google 16 листопада 2006 р.
Групи новин Google
Мапи сайту в архіві
Довідка для веб-майстрів - Карта сайту - Традиційний зразок мапи сайту
v
e - Google - Огляд - Alphabet Inc - Історія
L історія злиття та поглинання - Продукція - Критика - Побоювання щодо конфіденційності - Цензура - Домени
Пасхальні яйця - Не будьте злими - Реклама - AdMob
Рекламний пейзаж - AdSense: AdWords - Аналітика - Довідник - Партнери - DoubleClick - DoubleClick для видавців - Гаманець, Комунікація - Алло, Попередження
Apps Script - Duo - Календар - Контакти - Контакти - Історія Gmail - інтерфейс - Google+ - Групи - Hangouts - Вхідні - Синхронізація - Текст -to-Speech
Переклади: Транслітерація - Голос - Програмне забезпечення - Асистент - Хром - для Android,
для iOS - Веб-магазин Chrome - Програми
Розширення: Cloud Print - Земля - Небо - Місяць - Марс - Гаджети - Gboard - Окуляри - IME - Pinyin - Японська мова Фотографії - Тримайте новини та підсилювачі; Погода - Зараз
OpenRefine - Пошук - Панель інструментів - Платформи - Обліковий запис - Історія версій Android - Розробка програмного забезпечення - Android Auto - Android Pay
Android TV - Android Wear - Authenticator - Body - Книги - Бібліотечний проект - Caja - Картон, Cast - Chromecast
Chrome OS
Chromebit - Chromebook - Chromebox - Chrome Zone - Хмарна платформа - App Engine - BigQuery - BigTable - Compute Engine - Зберігання - Контактні лінзи - Користувацькі Пошук - Dart - Daydream - Земляний двигун - Fit - GFS - Скло - Перейти - G Suite - Класна кімната - Головна
Jamboard
Marketplace - Native Client - Nexus - OnHub - OpenSocial - Pixel - Play - Книги - Ігри - Фільми та посилювачі; Телебачення - Музика - Кіоск - Громадський DNS - Гаманець - Wifi - Розвиток - інструменти - API AJAX - Інвентор додатків - Інструменти закриття - Розробники
GData - Googlebot - Guava - Guice - GWS - KML - Kythe - MapReduce - Mediabot - Мапа сайту - Summer of Code - Web Toolkit
Search Console - Оптимізатор веб-сайтів - Swiffy - Видавництво - Blogger - Закладки - Диск, Документи, Таблиці, Слайди, Форми - Малюнки - Мої карти
Fusion Tables - Домени
FeedBurner - Картограф - Панораміо - Сайти - YouTube - Миттєвий YouTube - YouTube Червоний - Vevo - Zagat
Пошук по часовій шкалі - Техніка - Пошук по блогах - Книги - Переглядач програм Ngram - Користувацький пошук - Фінанси
Рейси
Зображення
Карти
Марс
Місяць: Небо - Перегляд вулиць - Покриття - Конкуренція - Побоювання щодо конфіденційності - Новини
Архів - Патенти - Публічні дані - Науковий співробітник <Покупки
Usenet - Відео
Алгоритми
PageRank - Панда - Пінгвін - Колібрі - Особливості
Історія веб-сайтів - Персоналізована - Реальний час - Миттєве Sear ch - Безпечний пошук - Голосовий пошук - Аналіз - Інформація про пошук - Тенденції - Графік знань - Сейф знань - Скасовано - Аардварк - Відповіді - браузер Синхронізація: База: Buzz - Оформити замовлення - Каркас Chrome: Клацніть для дзвінка - Cloud Cloud - Пошук коду - Течії - Настільний
Словник
Каталог
Dodgeball - Fast Flip - Friend Connect - Gears - GOOG-411 - Google TV
Jaiku - Knol
Health
iGoogle
Image Labeler - Labs - Latitude - Lively - Mashup Editor - Notebook - Пропозиції - Orkut - Pack - Creator Page Creator - Picasa - Веб-альбоми Picasa Picnik - PowerMeter - Q & amp; A Reader - Конвертор сценаріїв - SearchWiki - Sidewiki - Слайд - в квадраті - Обговорення - Оновлення - Урхін - Відео - Хвиля, Інтернет Акселератор - Люди в Аль-Гор - Алан Еустас - Алан Мулалі - Аміт Сінгал - Ен Маттер, Девід Драммонд, Ерік Шмідт, Джефф Дін, Джон Доер Джон Джон Геннесі - Кришна-Бхарат - Метт Каттс - Патрік Пікетт - Пол Отелліні - Омід Кордестані - Рейчел Уотстоун - Реджен Шет, Рам Шрірам - Рей Курцвейл - Рут Порат - Салар Камангар - Шірлі М Тільман - Сундар Піхай - Сьюзан Войцецький - Урс Хьолзле, Вінт Серф - Засновники - Ларрі Пейдж - Сергій Брін - Інше - Арт-проект - Calico - Поточні експерименти з Chrome - Код-в - Code Jam - День розробника - Бізнес-групи Google - Створено Код - Вивільнення даних - Виведення - Експерт Google для розробників - Google for Work - Автомобіль без водіїв - Просвіт Землі - Волокно - GV - Google Китай - Google Express «Гуглізація - Гранти - Googleorg», премія Місяця X - Project Fi Дизайн матеріалів - Motorola Mobility - WiFi - X - Події - Наукова ярмарка - Серхологія - I / O - День розробника - AtGoogleTalks - Код Jam - Конкурс з високою відкритою участю - Проект із входом - Проекти - Ара - Лун - Танго - Люк на люк - Нерухомість - 111 Восьмий авеню - Googleplex
Логотип
Doodle4Google - Google Doodles - Пов'язані - AI Challenge - Бомба - Goojje - Вулиці міста Монополії - Єдність - Категорія
Портал


Sitemaps

Random Posts

La Porte, Indiana

La Porte, Indiana

La Porte French for "The Door" is a city in LaPorte County, Indiana, United States, of which it is t...
Fernando Montes de Oca Fencing Hall

Fernando Montes de Oca Fencing Hall

The Fernando Montes de Oca Fencing Hall is an indoor sports venue located in the Magdalena Mixhuca S...
My Everything (The Grace song)

My Everything (The Grace song)

"My Everything" was Grace's 3rd single under the SM Entertainment, released on November 6, 2006 Unli...
Turkish Straits

Turkish Straits

The Turkish Straits Turkish: Türk Boğazları are a series of internationally significant waterways in...