URL адрес — что это такое и как узнать урл страницы сайта, изображения или видео

Здравствуйте, уважаемые читатели блога Goldbusinessnet.com. Продолжаем изучение важнейших составляющих интернета, и на очереди у нас понятие «URL адрес» (урл по-простому), который юзеры вводят в адресную строку браузера (какой веб-обозреватель лучше?) в чистом виде.

И именно URL является базовым параметром атрибута href, с помощью которого создаются гиперссылки, входящие в состав гипертекста как основы Мировой Паутины. Благодаря урлу пользователи получают возможность посетить нужный сайт и получить искомую информацию.

По большому счету, «URL» связан с терминами «URI» и «URN», краткое объяснение сути которых я, безусловно, дам в ходе этой публикации. Кроме этого, мы разберем, из чего состоят урлы на наглядных примерах, какого вида они бывают и как находить адреса изображений, страниц сайта, видео и копировать их для своих нужд.

Что такое URL адрес и из чего он состоит?

Итак, начнем с самого начала, то есть с URI (Uniform Resource Identifier), аббревиатура которого в переводе с английского означает «Унифицированный идентификатор ресурса». Это уникальный набор символов, позволяющий идентифицировать любой ресурс в интернете: страницу сайта, файл, электронный почтовый ящик и т.д.

Составляющими URI являются URN (Uniform Resource Name — Унифицированное Наименование Ресурса) и URL (Uniform Resource Locator — Унифицированный Указатель Ресурса). Первый идентифицирует конкретный веб-ресурс по его названию в пространстве имен, а второй указывает на его местоположение в сети и обеспечивает доступ к нему посредством конкретного метода. Схематически это можно изобразить так:

URI является более общей системой идентификации. Она может включать в себя либо URN, либо URL, либо оба идентификатора вместе. То есть, URN и URL являются частными случаями URI. Попробую объяснить, что значит каждый термин, на наглядном примере из реальной жизни.

Допустим, имеется адрес (г. Нижний, ул. Верхняя, д.4, кв.15), до которого можно добраться разными способами в зависимости от степени удаления пункта отправления. Скажем, сосед Пупкина доберется к нему пешком (это будет в данном случае методом доступа к объекту).

А родственнику, живущему за несколько тысяч километров, придется задействовать комплексный вариант (прилететь на самолете, приехать по нужному адресу на такси и дойти оставшееся расстояние пешком). Способ доступа в этом случае будет весьма другим (самолет - такси - пешком). В контексте выше сказанного это и есть URL (адрес + метод доступа к объекту).

Имя владельца квартиры Василий Васильевич Пупкин. Возьмем за основу все население города Нижний, где каждый имеет свое имя (причем полные тезки также могут быть идентифицированы, поскольку имеют паспорт с уникальным номером). Тогда именное пространство можно назвать «Жители Нижнего», а В.В.Пупкин — уникальное имя в нем. Все это и составит URN.

Ну а полная информация, включающая адрес и имя находящегося по этому месту жительства человека — URI. Конечно, это в известной степени упрощенние, но зато оно помогает постичь суть без излишнего напряжения мысленных ресурсов.

Нас интересует в первую очередь унифицированный указатель, поскольку именно он является основной идентификационной системой, используемой широко на практике в глобальной сети. Поэтому далее мы и уделим основное время описанию структурных особенностей URL.

Структура УРЛ и его важные особенности для сведения вебмастеров

Итак, мы с вами определили в общих чертах, что же такое URL адрес. Это путь до любого файла (вебстраницы сайта, картинки, видео и др.). Начнем с простого примера. Вот как может выглядеть локатор в общем виде для одного из файлов, находящегося в определенной директории (папке):

http://goldbusinessnet.com/folder1/file.extension

В качестве реального примера привожу урл адрес файла, который содержит логотип этого блога:

http://goldbusinessnet.com/images/gold-8.png

Помните, чуть выше я упомянул, что URL содержит не только указание на конкретное местонахождение объекта в сети, но и то, каким способом можно получить к нему доступ? Так вот, протокол HTTP, стоящий в самом начале унифицированного указателя, как раз и является инструментом, помогающим открыть файл по указанному адресу в браузере.

У протокола передачи данных HTTP есть вариант HTTPS, обеспечивающий защищенное соединение и к переходу на который в последнее время склоняют вебмастеров поисковики, особенно Гугл (что, впрочем, будет благом для всех, особенно для коммерческих ресурсов и проектов, где используется передача персональных данных пользователей).

Но вернемся к нашему примеру. После обозначения типа протокола «http://» (а в общем случае способа доступа, поскольку в урлах не всегда применяется протокол, но об этом ниже) идет уникальное название домена (читайте о доменных именах и о том, как их зарегистрировать). Кстати, доменное имя может быть указано и с WWW:

http://www.goldbusinessnet.com/folder1/file.extension

Тогда наблюдается присутствие в интернете двух разных ресурсов (с WWW и без) с одинаковым содержанием. С точки зрения поисковиков это зеркала, являющиеся по своей сути дублями, которые жутко мешают прожвижению.

К тому же, обратные ссылки, проставленные на ваш сайт, могут быть распределены в неизвестных пропорциях между зеркалами. Поэтому необходимо предпринять действия по определению главного домена и склейке зеркал, в том числе посредством 301-ого редиректа.

С доменным именем мы разобрались. Кстати, при создании сайта домен вашего проекта будет считаться корневой папкой с точки зрения файловой структуры сервера. Вследствие этого цепочку после двойного слэша можно воспринимать как последовательность вложенных друг в друга папок (их может быть несколько), где на конце урла находится нужный файл:

http://goldbusinessnet.com/folder1/folder2/folder3.../file.extension

Этот файлик идентифицируется по его названию и расширению, в нашем примере это «file.extension». Причем, расширение может быть самым различным (html, php, png и т.д.).

Но здесь надо иметь ввиду, что на серверах обычно используются Unix-подобные ОС, где, в отличие от Windows, расширения для файлов не являются обязательными и часто не используются, поэтому запись «file.extension» может вполне быть принята за название файлика с точкой посередине. Эта информация нам может пригодиться в дальнейшем.

Для полноты картины нужно еще упомянуть об адресах страниц сайтов в интернете. Чаще всего встречаются урлы трех основных видов (ЧПУ), которые наиболее предпочтительны при раскрутке веб-проекта:

http://goldbusinessnet.com/vazhnye-terminy-i-ponyatiya/kontekst-chto-eto-takoe.html
http://goldbusinessnet.com/vazhnye-terminy-i-ponyatiya/kontekst-chto-eto-takoe
http://goldbusinessnet.com/vazhnye-terminy-i-ponyatiya/kontekst-chto-eto-takoe/

Вроде бы, первый вариант больше всего отвечает разобранной нами схеме. Но в случае с URL страницы не все так однозначно. В теории это состоит следующим образом (попробую объяснить все на примере обычного блога, по-моему, он достаточно наглядный и понятный большинству).

Основываясь на приведенном мною в самом начале данного раздела статьи общем примере урла, можно было бы рассуждать следующим образом. В соответствии с иерархией в блоге роль подпапок играют разделы (рубрики или категории) ресурса, в которые включены отдельные страницы (файлы). Ну а главная страница — это основная папка (корень сайта в файловой структуре сервера), содержащая рубрики.

При стандартных серверных настройках каждый URL, соответствующий каталогу (папке), должен заканчиваться слэшем, в этом случае обработчик "поймет", что необходимо отобразить листинг всех файлов, которые там содержатся, а не какой-то конкретный объект, поиск которого будет осуществляться, если слеша не будет (таким образом вы экономите реурсы сервера).

В соответствии с этими рассуждениями локатор главной должен заканчиваться «/», поскольку домен является корневой директорией:

http://goldbusinessnet.com/

По этой же причине такой же вид урла соответствует рубрикам сайта:

http://goldbusinessnet.com/kompyuter-i-internet/

А вот статические или страницы записей выводятся в таком обличье:

http://goldbusinessnet.com/domen-i-xosting/offerhost-premium-xosting-sovremennym-funkcionalom

либо:

http://goldbusinessnet.com/domen-i-xosting/offerhost-premium-xosting-sovremennym-funkcionalom.html

Помните, чуть выше я упоминал о двух легитимных вариантах существования файлов в Unix-подобных операционных системах (с расширением и без)?

Однако, подобные рассуждения не совсем корректны в том числе потому, что подавляющее большинство современных сайтов работают под управлением CMS, которые генерируют странички сайта динамически "на лету" на базе имеющихся шаблонов с расширением .php, включающих комплекс соответствующих функций.

Все шаблоны, отвечающие за формирование различных страничек сайта (главной, рубрик, вебстраниц записей и т.д.) входят физически в одну директорию текущей темы WordPress. Таким образом, содержание всех названных страниц в конечном виде существует лишь при просмотре в браузере, а не физически на сервере. К слову, с файловым строением темы вы можете познакомиться в этой статье, материал которой даст вам дополнительные сведения.

Кто привык копать глубоко и желает более подробно изучить этот архиважный аспект, отсылаю вас к очень качественному материалу, где он освещается на основе первоисточника в виде спецификации общего синтаксиса URL, и в котором красной нитью проходит утверждение, что урл вообще (вне зависимости от своего содержания) указывает на абстрактное местоположение ресурса, а не на его конкретное физическое расположение.

Резюмируя и суммируя все приведенные доводы, могу утверждать, что с точки зрения синтаксиса все образцы рассмотренных урлов для страниц сайта (со слешем на конце, без него и с расширением .html) вполне корректны и пригодны для использования.

Более того, ни один из них не имеет сколь-нибудь заметного преимущества в глазах поисковых систем. Единственное, для обеспечения правильной индексации надо также установить 301 редирект в случае применения URL со слешем или без в конце.

Надеюсь, что предоставленная информация поможет вам определиться с настройкой урлов на своем сайте. Для проектов, работающих на WordPress, например, постоянные ссылки сайта можно легко настроить в соответствующем разделе админ-панели.

Важное замечание! Настройку ссылок желательно производить в самом начале создания проекта, дальнейшие изменения могут замедлить или приостановить продвижение сайта, поскольку переиндексация у поисковиков не происходит мгновенно.

Выше мы рассмотрели частные случаи различных типов локаторов, ну а общая блок-схема, демонстрирующая структуру URL, выглядит следующим образом:

Пожалуй, следует дать некоторые разъяснения по отдельным составляющим.

Схема. Как я уже отмечал выше, не всегда средством передачи данные служит протокол, хотя это наиболее распространенный вариант. Эту роль вполне может играть псевдопротокол (например, тот же mailto, являющийся средством отправки сообщения по электронной почте):

mailto:goldbusinessnet@gmail.com

Вообще, для полноты информации вы можете ознакомиться с перечнем используемых схем на соответствующей страничке Википедии.

Кроме HTTP и HTTPS вебмастерами и разработчиками очень часто применяется на практике и FTP (тут об этом протоколе необходимые подробности), который очень удобен при работе с файлами своего проекта на сервере хостинга (что это такое и как купить место для сайта), если при этом воспользоваться помощью соответствующей программы (например, Файлзилла).

В таком случае для доступа к нужному файлу или папке понадобиться указать логин и пароль, а также порт (если он отличен от стандартного, применяемого по умолчанию):

ftp://login:password@/goldbusinessnet.com:3542/folder1/file.extansion

Здесь в качестве хоста указано имя домена («goldbusinessnet.com»), но вполне может быть использован и IP-адрес, который идентифицирует устройство в сети интернет (тут о взаимодействии ай-пи адресов, ДНС и доменных имен). Ну а «folder1/file.extansion» — это уточняющий URL-путь до объекта.

Для вебмастеров еще один нюанс заключается в том, что любой движок может генерировать локаторы, в которых присутствуют так называемые GET-параметры, следующие после знака «?» в конце урлов. Если параметров несколько (каждый из них может иметь свое значение), то они разделяются знаком «&»:

http://site.ru/category1/article2/?parameter1=1&parameter2=2&parameter3=3

Страниц с такими адресами на сайте может набраться достаточное количество, причем их контент может быть тождественным с основными вебстраницами. Те, кто имеет свои блоги на Вордпрессе, вполне могут столкнуться с ситуацией, когда наличие древовидных комментариев инициирует генерирование урлов с replytocom:

http://site.ru/category1/article2/?replytocom=4321

А это и есть самые настоящие дубли, большое количество которых способно существенно снизить скорость индексирования страничек, а, значит, и косвенным образом замедлить продвижение веб-ресурса. Поэтому, думаю, будет уместным в этом месте дать ссылку, перейдя по которой вы узнаете, как бороться с самым разнообразным дублированным контентом на Вордпресс.

Если есть цель улучшить навигацию и направить посетителя не просто на нужную страницу, но в определенное место на ней, где есть искомая информация, то используют якорь (по-английски anchor), с помощью которого создаются хеш-ссылки:

http://site.ru/category1/article2/#anchor1

К выше сказанному следует добавить, что в стандартных урлах рекомендуется использовать лимитированную выборку знаков: буквы латинского алфавита в нижнем регистре [a-z], цифры [0-9], точку [.], нижнее подчеркивание [_], и дефис [-].

Такие ограничения действуют со времени зарождения интернета, но с некоторых пор ввиду развития глобальной сети появилась необходимость формировать URL с применением символов национальных языков, включая русский. Такая возможность появилась, но для ее реализации требуется кодировка (encoding) любых знаков в формате ASCII, который понимают браузеры.

Кодирование и декодирование URL

Итак, после некоторых предпринятых соответствующими международными организациями усилий любой сайт может использовать для адресов своих страниц локаторы, включающие буквы практически любого языка. Нас интересует русский, поэтому можете проверить сие утверждение, введя в адресную строку браузера урл одной из страниц Русской Википедии:

https://ru.wikipedia.org/wiki/Бит

Адрес корректно отобразится:

А после нажатия кнопки «Enter» откроется соответствующая страничка. Теперь попробуйте скопировать этот адрес в буфер обмена и вставить его в любой документ (например, в блокнот Windows). Получится такой набор:

https://ru.wikipedia.org/wiki/%D0%91%D0%B8%D1%82

Это и есть закодированные русские буквы, которые web-браузер автоматически преобразует в читабельный текст на кириллице. Кстати, в сети есть немало сервисов, которые предлагают быстрое кодирование и декодирование содержания URL, например, вот этот:

Конечно, для пользователей рунета гораздо более привлекательным является текст на русском, содержащийся в локаторе (кстати, и доменное имя может быть кириллическим).

Однако, формировать урлы на кириллице для страниц своего сайта я все-таки советую только в том случае, если ваш проект имеет какие-то свои особенности, вследствие которых именно русские символы в URL будут эффективнее привлекать посетителей, особенно целевую аудиторию.

В других случаях все же оптимальнее будет применять латиницу (а для WordPress использовать плагины транслитерации для автоматического преобразования русских букв в постоянных ссылках в латинские), поскольку это исключает некоторые возможные ошибки, а поисковые системы не делают языковых предпочтений в этом аспекте при ранжировании.

Как узнать URL адрес изображения, видео или страницы сайта?

При работе в интернете да и просто во время сёрфинга или поиска информации в сети очень часто нужно просмотреть или скопировать адрес того или иного объекта. Где же взять нужный урл на открытой в браузере веб-страничке? Что касается URL страницы сайта, то его можно подсмотреть в адресной строке:

Правда, если данные передаются по обычному протоколу HTTP, то он, скорее всего, будет скрыт. Однако, если вы выделите урл, щелкните по нему правой кнопкой мышки и скопируете, выбрав из появившегося контекстного меню нужный пункт:

То после его вставки в нужное место он будет отображаться полностью (включая протокол «http://»). В случае использования владельцами веб-ресурса HTTPS локатора, соответствующего защищенному соединению, адрес страницы будет доступен в полном виде сразу же:

С помощью того же контекстного меню можно найти и скопировать также URL нужной вам гиперссылки, содержащейся в тексте:

Иногда нужно узнать урл размещенной в web-пространстве картинки. Для этого опять используйте тот же метод:

Только имейте ввиду, что если будете «Копировать картинку», то в буфер обмена поместите не ее URL, а само изображение, которое потом можете вставить в необходимое место.

Точно также есть возможность узнать и скопировать адрес видео. Ежели находитесь, например, в пределах Ютуба на странице с видеороликом, то это делается либо из адресной строки браузера, либо в разделе «Поделиться», находящемся чуть ниже ролика:

В случае присутствия видео в контенте веб-странички его URL- адрес можно получить с похожей легкостью (достаточно щелкнуть правой кнопкой мыши прямо по плейеру):

Таким вот образом вы легко можете получать и копировать URL-адрес практически любого объекта. Кстати, контекстное меню может принимать различный вид в зависимости от применяемого веб-браузера, но суть его опций остается практически идентичной.

Еще статьи по данной теме:
Самые интересные публикации из рубрики: Компьютер и интернет

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Чтобы ввести любой код, вставьте его между [php] и [/php]. Ссылка (URL), помещенная в текст комментария, не будет активной. C целью ее выделения и более удобного копирования можно заключить ее между тегами <pre> и </pre>.