Здравствуйте, уважаемые читатели блога Goldbusinessnet.com. Сегодня я продолжу говорить о составляющих внутренней оптимизации ресурса и хочу поведать вам, как создать карту сайта в Вордпресс с помощью такого полезного инструмента как плагин Google XML Sitemaps. Надо отметить, что вообще существует два вида сайтмапа: XML для поисковых систем и в формате HTML (как сделать sitemap для посетителей с помощью плагинов или без них).
Именно первый вариант и генерирует рассматриваемый сегодня плагин. Вообще, для чего нужен sitemap в виде файла с расширением .xml? Прежде всего для того, чтобы боты (или, выражаясь общедоступным языком, роботы) поисковиков не терялись на вашем сайте, а четко представляли, в каком направлении двигаться для индексирования его страниц (здесь о настройке индексации подробнее). Облегчая таким образом их работу, мы тем самым зарабатываем лишний плюсик в глазах Яндекса и Google’а, которые и держат под контролем львиную долю поиска в рунете.
Конечно, если у вас блог молодой и на нем еще мало контента, боты не заблудятся и без карты XML. Однако с ростом и развитием ресурса им все труднее будет ориентироваться в записях, поэтому рано или поздно, sitemap все равно придется создавать. Лучше сделать это сразу.
Плагин XML карты сайта в Вордпрессе и его установка
Вообще, есть много способов для создания sitemap в таком формате, но для движка WP одним из лучших решений является использование Google XML Sitemaps. Как видите, в названии плагина присутствует имя крупнейшей поисковой системы. Но пусть это вас не напрягает, поскольку все требования популярных поисковиков практически идентичны, а значит, это расширение создает легитимную карту сайта в том числе и для Яндекса.
Основное предназначение не только этого плагина, но и большей части других инструментов для WP с подобными задачами, состоит в построении списка URL страничек сайта, предназначенных для индексации Яндексом и Гуглом. Данный перечень ссылок на вебстраницы помещается в файл sitemap.xml в качестве его содержимого (куда могут входить еще и некоторые дополнительные данные), которое автоматически обновляется каждый раз после появления новых страниц.
Перед тем, как загрузить расширение, придется дать кое-какие разъяснения. Дело в том, что в последнее время все продвинутые инструменты по созданию сайтмапа предполагают создание динамической карты сайта, которая существует только в виртуальном варианте (в этом случае физически файл sitemap отсутствует на сервере хостинга).
Причем, актуальная версия карты со всеми URL опубликованных на данный конкретный момент страниц генерируется заново на полном автомате при каждом запросе поисковых ботов.
Более того, этот вариант исключает необходимость переименовывать виртуальный файлик карты при желании скрыть его от стороннего влияния, как пришлось бы поступить с реальным аналогом, созданном вручную и находящемся на веб-сервере. При вводе в адресную строку браузера пути до динамической карты, созданной плагином, ее содержание будет отображаться, но весь фокус в том, что изменить его никоим образом не удастся. Защищенность стопроцентная.
В общем, красота, да и только. Но для того, чтобы обеспечить корректную работу плагина, важно, чтобы в корневой директории вашего сайта (она может называться «public_html», «HTDOCS» или по имени вашего домена) не было бы физических файлов вида (возможно ранее вы создавали сайтмап вручную и эти объекты не были удалены):
sitemap.xml (для несжатой карты) sitemap.xml.gz (для сжатой карты)
Проверку на предмет присутствия выше означенных файликов можно осуществить посредством FTP-менеджера и в случае наличия просто их удалить.
Загрузка и установка Google XML Sitemaps происходит стандартным образом, занимает считанные минуты и может осуществляться несколькими способами, самый быстрый из которых реализуется через админку (переходите из левого меню в раздел «Плагины» — «Добавить новый», вводите в поиск название расширения. В результате этих действий система выдаст искомое и останется лишь воспользоваться кнопкой «Установить»):
После установки можете сразу активировать расширение путем нажатия на появившуюся здесь же соответствующую кнопочку либо непосредственно через раздел «Плагины».
Настройка Google XML Sitemaps
В результате активации плагина в левом меню админ-панели в разделе «Настройки» должен появиться пункт «XML-Sitemap», по которому и следует кликнуть для перехода к настройке:
Поскольку большинство опций уже отрегулировано по умолчанию и подходит для стандартного сайта, нет смысла разбирать их досконально, остановлюсь лишь на некоторых моментах, которые, на мой взгляд, наиболее важны и требуют дополнительных пояснений.
Имейте ввиду, что на последующих ниже скриншотах лишь некоторые настройки изменены по сравнению с дефолтными (проставлены или, наоборот, сняты соответствующие галочки), о которых я и скажу подробнее. Именно в таком виде я их и использую.
Первый блок, появляющийся сразу же после перехода к настройкам, содержит информацию, которая включает путь до созданного виртуального файла sitemap, а также сообщения о том, что поисковые системы Google и Bing успешно оповещены о последних изменениях в содержании карты (не переживайте, как я уже сказал, Яндекс тоже не останется в стороне):
Базовые параметры. Тут несколько нюансов, на которых надо остановиться. Галочки напротив первых двух пунктов активируют опции, которые обеспечивают своевременное извещение поисковых систем о проиcшедших изменениях на вашем ресурсе и, соответственно, в сайтмапе:
Еще некоторые детали функционала, требующие пояснений:
«Add sitemap URL…» — здесь отмечайте чекбокс (ставьте галочку) только в том случае, если в корневой папке сайта нет реального robots.txt (подробнее об особенностях формирования этого важного файла). В случае его отсутствия начинает действовать виртуальный аналог роботс тхт, создаваемый движком WP автоматически, куда и добавится URL карты сайта, если вы активируете данную настройку. Напоминаю, что в реальном robots.txt путь до сайтмапа указывается вручную.
«Try to automatically compress the…» — очень полезная функция, обеспечивающая сжатие файла карты (в формате sitemap.xml.gz) при необходимости его передачи. Скорее, больше подходит для крупных проектов с объемным сайтмапом. Эту опцию можно включить, заполнив чекбокс, и для небольших сайтов. Однако, если вы начнете получать искаженный контент или ошибки кодировки в карте, но немедленно ее деактивируйте.
Дополнительные страницы. В этом разделе вы можете добавить файлы и страницы, которые не принадлежат блогу WordPress, но которые необходимо включить в карту:
Скажем, вы владелец домена my_site.ru, а файлы блога как его составной части располагаются в поддиректории (my_site.ru/blog), включая карту, которая по умолчанию будет содержать только ссылки на странички блога. Тогда с помощью этого раздела настроек вы сможете прописать в сайтмапе, например, URL главной страницы всего проекта (http://my_site.ru).
После того, как вы укажете урлы нужных веб-страниц, можно добавить и такую информацию для них как приоритет (priority), частота изменений (changefreq) и дату последнего редактирования (lastmod) в формате YYYY-MM-DD (год, номер месяца и дата) для тонкой настройки индексации.
Эти данные с точки зрения легитимности sitemap не являются обязательными и для небольших вебсайтов не так уж важны, а вот для основательных проектов они могут оказать существенную пользу. В любом случае, вреда от присутствия этой информации не будет точно. Ежели решили копать до конца, то ознакомьтесь более подробно с принципами построения XML карты.
Приоритет статьи. Это как раз один из дополнительных параметров, упомянутый чуть выше и измеряемый в диапазоне от 0 до 1, который и устанавливает степень важности той или иной страницы. Дело в том, что в ходе одной сессии роботы поисковых систем не всегда сканируют странички в полном объеме, правда, в основном это касается больших порталов с огромным объемом контента. Правильно расставленные приоритеты при этом укажут ботам наиболее важные материалы, которые, вероятнее всего, они точно не пропустят.
Если вы используете XML Sitemaps для стандартного блога или сайта WordPress, то рекомендую отметить первый пункт, поскольку, на мой взгляд, приоритет, автоматически вычисляемый на основании количества комментариев на всегда корректен и согласуется с тем, что бы вы хотели сами получить (а расчет на основе других факторов здесь отсутствует).
К тому же, включение этой опции может привести к дополнительной нагрузке на сервер, а это не айс. Более того, ресурсы, число страниц на которых не превышает несколько сотен и даже тысяч, роботы обычно обходят без проблем. А в этом случае приоритет не имеет решающего значения.
Содержание карты сайта. Этот раздел настроек позволяет определить, странички какого формата будут включены в список, предназначенный для индексирования. По умолчанию здесь отмечены домашняя страница, статьи и статические страницы:
Если вебстраницы категорий вашего ресурса не содержат дублирующего контента (наподобие того, как это реализовано на этом блоге), то я бы рекомендовал добавить и их, если, конечно, структура у вас стандартная (это важные разделы, которые заслуживают попадания в индекс, поскольку через них, к примеру, на статьи могут переходить посетители).
Excluded Items. В этом разделе настроек можно исключить из сайтмапа категории и страницы:
Для статических страничек и статей необходимо указать через запятую их идентификатор (как определить ID страницы в админ-панели Вордпресс).
Change Frequencies. Можно определить частоту изменения (редактирования) различных вебстраниц блога. Настройки по умолчанию выглядят логичными:
Обратите внимание, что данная характеристика носит для поисковиков лишь рекомендательный характер и не обязывает их строго действовать в соответствии с установленными инструкциями.
Приоритеты. Этот блок тоже можно оставить без изменений:
Хотя для статей можно повысить приоритет до 0.8, например, если на вашем блоге они являются основным объектом продвижения.
После настройки плагина Google XML Sitemaps карта будет сформирована и о всех изменениях на вашем ресурсе поисковые системы будут своевременно оповещаться. В качестве заключительного шага вам непременно следует добавить сайтмап в панели вебмастеров Яндекса и Гугла, что усилит гарантию своевременной индексации вашего контента.
Так оставлять sitemap.php или этот файл не нужен?
Не понял вопроса, Дмитрий. Вообще-то файл карты сайта генерируется плагином с расширением .xml (sitemap.xml).
Можно ли с этим плагином сделать разное значение приоритета для разных статических страниц? Т.е. выделить 3-4 страницы приоритетом 0,8, а остальным — 0,5?
Ольга, к сожалению, подобные настройки здесь не предусмотрены. А оно Вам надо? Все-равно роботы поисковиков обычно вполне корректно и регулярно сканируют все страницы стандартного сайта. Или у Вас крупный ресурс с десятками тысяч страниц?
Спасибо за потрясающую и интересную статью!
какая-то я косорукая, право(((( вроде бы всё сделала как вы написали, но код посмотрела — он какой-то странный! хотя, может так и надо?!
Алла, а что в нем странного? 🙂
ну, не «человеческий» какой-то))) хотя, я посмотрела ваш роботс, поняла, что зря волнуюсь — такой же))
Приветствую! Хочу уточнить. Я сделал карту от Google XML Sitemaps, но я так понял это карта для ботов, и люди ее видеть не будут. И нужно еще делать карту для людей на дагон дезижн, чтоб она как реальная страница отображалась. Я правильно понял? Заранее спасибо.
Абсолютно точно, Александр, Вы правильно все поняли.
Спасибо за информацию! Добавил ваш блог в закладки, потому что нигде еще не встречал такого подробного и профессионального освещения каждого вопроса! У вас отличный блог! Я только начинаю свой блог, и буду использовать ваш, как практическое руководство! Хорошо, когда есть такие качественные ресурсы как ваш!
Спасибо, Александр. 🙂
Все хорошо и доходчиво.
Как я понял плагин Google XML Sitemaps идеально подходит для поисковой системы google. А есть что-нибудь для Яндекса?
Ну, этот плагин работает на Яндекс тоже, если войдете в Яндекс Вебмастер, убедитесь в том, что Яндекс загружает и сканирует файлы Sitemap. Настройка индексирования — файлы Sitemap.
Спасибо за описание robot.txt, более подробного материала я еще не встречал.
Спасибо за оценку.