Что такое URL: понятия, особенности и рекомендации по созданию
Знакомство с каждой веб-страницей начинается с адреса в строке браузера. Простой, информативный и логичный URL легче воспринимается пользователями. Это положительно влияет на позицию сайта в поисковой выдаче, увеличивает узнаваемость компании и трафик. А значит, правильный выбор URL-адреса позволяет без особых затрат увеличить прибыль.
Редакция MC.today разобралась, что такое URL, как его правильно генерировать, и какие рекомендации при работе с ним следует учитывать.
Что такое URL
URL – это адрес любого ресурса во Всемирной паутине: сайта, веб-страницы, видео, документа или файла для загрузки. Аббревиатура расшифровывается, как Uniform Resource Locator, или «всеобщий указатель ресурсов». Зная этот код, пользователь может открыть нужный ему сайт, найти файл или поделиться с кем-нибудь ссылкой.
Простыми словами, URL позволяет узнать, где хранятся нужные вам данные. В качестве аналогии можно представить покупателя, который хочет найти в супермаркете полку с, к примеру, синими носками. Администратор опишет ему точный путь: секцию, отдел, ряд, место в ряду, номер полки. Так и URL описывает путь к серверу в Сети, папке на сервере, где лежит искомая страница, а иногда даже к конкретному абзацу на этой странице.
Определить URl-адрес веб-страницы просто – достаточно посмотреть на адресную строку браузера. Например, адрес страницы, которую вы читаете, выглядит так: https://mc.today/chto-takoe-url/. Если вам нужно его скопировать, нажмите на значок «Поделиться этой страницей» и выберите в выпадающем меню пункт «Копировать ссылку».
История URL адреса
В 1989 году программист международного центра высоких энергий в Женеве Тим Бернерс-Ли предложил проект Всемирной паутины, или World Wide Web. Идея состояла в том, чтобы создать систему взаимосвязанных гипертекстовых документов, которые расположены на компьютерах по всему миру.
Для реализации замысла Тиму и его помощникам пришлось разработать три технологии, благодаря которым появилось то, что мы сегодня считаем интернетом. Это HTTP, HTML и URL.
Протокол HTTP позволяет передавать файлы между клиентом и сервером. Язык гипертекстовой разметки HTML помогает создавать документы, которые ссылаются друг на друга. А URL дает надежный способ ссылаться на файл. Для этого в него входит информация о протоколе передачи данных, местонахождении сервера в интернете и файла на этом сервере.
Первый в мире веб-сайт Бернерс-Ли создал 20 декабря 1990 года по адресу http://info.cern.ch (теперь он находится в архиве). В 1994 году он же выложил в сеть официальный стандарт технологии URL. А в 1996 году браузеры научились добавлять http:// и www. за пользователей автоматически.
Структура URL адреса
URL состоит из различных частей. Одни из них являются обязательными в любом адресе, другие используют в зависимости от типа запроса. На сайте веб-документации MDN анатомию URL иллюстрируют таким примером:
http://www.example.com:80/path/to/myfile.html?key1=value1&key2=value2#SomewhereInTheDocument
Протокол
Наверное, вы заметили, что адреса многих сайтов начинаются с последовательности символов http:// – это протокол. Его можно сравнить с языком, на котором общаются через Интернет компьютеры. Чаще всего встречается HTTP-протокол или его безопасная версия – HTTPS. Однако существуют и менее известные протоколы, такие как ftp: для передачи файлов, или mailto:, который открывает почтовый клиент.
Доменное имя
Основная часть URL-адреса – доменное имя. В нашем случае это www.example.com. Доменное имя состоит из префикса, например, www., названия сайта и расширения домена, например, .com. Префикс www указывает на функциональное значение домена. В данном случае это веб-сервер. Для ftp-сервера запись выглядела бы ftp.example.com. А для почтового сервера – mail.example.com.
Расширения домена также известны как доменные зоны, или домены верхнего уровня (Top Level Domains). Они бывают национальными и общими. Национальные домены выделены для конкретных стран и состоят из двух букв. Например, .ua значит – Украина, .uk – Великобритания, .me – Черногория и так далее.
Наиболее распространены общие домены, которые, как правило, состоят из трех букв. Например, .com, .org, и .net. Каждый из них используется для сайтов определенной тематики. Для бизнеса – .com, для некоммерческих организаций – .org, для интернет-компаний – .net.
Доменные имена помогают браузерам находить веб-серверы. Однако тут не всё просто. Дело в том, что компьютеры оперируют адресами из чисел. Так, например, «компьютерный», или IP-адрес сайта MC.today выглядит так: 188.114.98.224. Понятно, что запоминать такие адреса людям было бы крайне неудобно.
Поэтому, когда вы вводите в браузере название сайта, он сначала обращается к специальной базе данных, которую называют система доменных имен (DNS). Там домен MC.today превращается в 188.114.98.224, и браузер получает фактический адрес сайта, по которому его можно найти в сети.
Порт
В нашем примере порт :80 – это технический параметр, который помогает системе определить, от кого поступили данные и какой программе их передать дальше. Обычно веб-сервер использует порт 80 для протокола HTTP и порт 443 для HTTPS.
Путь к ресурсу на веб-сервере
Адрес /path/to/myfile.html определяет расположение ресурса на веб-сервере. В данном случае файл myfile.html находится в папке to, которая вложена в папку path.
Запрос
Запрос – это часть URL после знака «?» Эта информация нужна для передачи дополнительных данных на сервер. Например, если в поиске интернет-магазина stylus.ua ввести слово «samsung», то адрес URL поменяет вид на https://stylus.ua/uk/search?q=samsung.
Якорь
Якорем называют идентификатор, который используется для перемещения к определенной части страницы. Обычно он расположен в конце URL-адреса после символа #. Так, например, ссылка на эту часть статьи выглядит так: https://mc.today/chto-takoe-url/#_URL-3
Виды URL
URL-адреса веб-страниц могут быть статическими и динамическими.
- Статический URL – это постоянный адрес, который остается неизменным, пока владелец сам не внесет в него какие-нибудь изменения. Пример: https://mc.today/uk/category/korisni-teksti/
- Динамический URL генерируется в ответ на запросы пользователей и содержит разделительные символы «?», «=», «&», после которых указаны дополнительные параметры страницы. Динамические адреса можно увидеть, когда пользователи применяют фильтры в интернет-магазинах или пользуются поиском по сайту. Например, в результате поиска по слову IT получаем https://mc.today/uk/?cat=19200&s=IT
Форматы URL
Транслитерация
Веб-стандарт RFC3986 определяет список разрешенных и запрещенных для использования в URL символов. К запрещенным в частности относятся пробелы и кириллические символы. Поэтому владельцы сайтов в Украине широко используют транслитерацию.
К примеру, адрес этой страницы https://mc.today/chto-takoe-url/. Сразу понятно, что она отвечает на вопрос «Что такое URL?» Адреса, которые получены с помощью транслитерации легко читать и запоминать. Кроме этого поисковые системы легко распознают в них ключевые слова, что положительно влияет на продвижение сайтов.
Латиница
Еще один способ замены кириллических знаков в URL – перевод слов на английский. Фразу «что такое» в этом случае следует заменить на «what is». Этот вариант легко распознается поисковыми роботами, но может быть понятен не всем пользователям.
Кириллические URL и URL-шифрование
Рабочая группа по доменным именам на национальных языках (IDN) начала работу в 1999 году. Чтобы не разрабатывать новую систему доменных имен, там придумали кодировку, которая шифрует символы других алфавитов с помощью уже доступных.
Ее назвали Punycode и постепенно внедрили в популярные браузеры. Однако за эти годы кириллические домены так и не стали популярны. С одной стороны, они лучше запоминаются и позволяют использовать в URL ключевые фразы. С другой – имеют ряд серьезных недостатков.
- Как мы уже говорили, запись URL-адресов возможна определенными символами. Поэтому при копировании и вставке кириллического URL в сообщение он шифруется. В результате вы получите длинный набор непонятных знаков. Не каждый отважится перейти по такой ссылке, так как ее сложно отличить от спама.
- Создать адрес электронной почты в формате «@домен.укр» не получится. Он будет выглядеть, как «@xn--d1acufc.xn--j1amh».
- Кириллические адреса тяжело распознавать поисковым роботам, что негативно влияет на SEO.
Человекопонятные URL
Google и другие поисковые системы советуют использовать при создании сайтов понятные для пользователей адреса. Такие URL называют семантическими, человекопонятными или просто ЧПУ. Они состоят из логических частей, содержат информацию о текущей веб-странице и отображают ее место в структуре сайта.
Несемантические адреса, напротив, состоят из адреса сайта, названия скрипта (набора команд) и строки запроса. При этом часто содержат данные, не имеющие смысла для обычного пользователя. Это могут быть цифровые индикаторы содержания, номер сессии, кодированные данные и так далее.
Например, по адресу https://example.com/viewpage.php?category_id=13 сложно сделать какой-то вывод о содержании страницы. Зато семантический адрес https://example.com/news/2022 сразу говорит нам, что это раздел с новостями за 2022 год. При этом понятно, что если подняться на уровень выше, то можно посмотреть новости за другие годы. Человекопонятные URL имеют ряд преимуществ:
- Позволяют оценить контент еще до перехода по ссылке.
- Легко читаются и запоминаются. Поэтому их можно передать кому-нибудь даже устно.
- В ЧПУ легко ввести ключевые фразы.
- Семантические ссылки обеспечивают ускоренную и интуитивно понятную навигацию по сайту. Зачастую пользователю достаточно удалить часть адреса, чтобы перейти к нужному разделу.
Есть ряд правил, которые нужно соблюдать, чтобы сформировать на сайте правильные ЧПУ:
- Использовать транслитерацию по заранее согласованным правилам. Добавим, что правила транслитерации украинского алфавита латиницей установлены постановлением Кабинета Министров Украины N 55 от 27 января 2010 года.
- Заменять пробелы и знаки препинания на дефис или нижнее подчеркивание.
- Не использовать в адресах заглавные буквы.
- По возможности делать адреса короткими.
Рекомендации по созданию URL
Чтобы выбрать хороший адрес сайта, нужно учесть множество факторов. Часть из них описана в разделе по оптимизации URL справки Google.
- Основной частью URL-адреса является доменное имя. Идеально, если оно будет коротким и запоминающимся. Желательно также, чтобы оно воспринималось на слух так же, как пишется. Лучше не использовать в названии буквы, которые можно ввести несколькими способами. Например, ц (c или ts), в (v или w), я (ya или ja) и так далее.
- Используйте в URL ключевые слова. Поисковые системы учитывают этот фактор при сортировке сайтов в результатах поиска.
- Общая длина URL не должна превышать 80 символов. Более длинные ссылки в поисковой выдаче обрезаются на средине.
- Если подраздел сайта находится далеко от главной страницы, то его URL может быть слишком длинным. Поэтому в некоторых случаях лучше убрать из адреса упоминания о разделах и категориях.
- Если ваш сайт посещают люди из разных регионов, используйте структуру URL, которая указывает на регион страниц. Рекомендуется использовать домен страны, например, example.ua. Или подкаталог с указанием на конкретную страну, например, example.com/ua/.
- Слова в веб-адресе лучше разделять знаком дефиса «-», а не нижним подчеркиванием «_».
- Не рекомендуется использовать в URL символы, не относящиеся к кодировке ASCII. Например, https://www.example.com/杂货/薄荷.
В популярных видах бизнеса самые короткие и красивые домены могут быть уже заняты. И если с формированием URL возникли сложности, на помощь придут сервисы для генерации доменных имен. Например, Instant Domain Search или DomainWheel.
Может случиться, что вы придумали идеальный домен, но он уже кем-то занят. Не стоит расстраиваться. Можно выкупить домен у владельца, перехватить его продление, если владелец забудет сделать это вовремя, или подобрать другую доменную зону.
Итак, мы выяснили, что URL-адрес – это адрес любого веб-сайта, страницы или файла во Всемирной паутине. URL состоит из обязательных и опциональных частей. Адреса большинства сайтов состоят из доменного имени и протокола. При этом протоколы HTTP/HTTPS браузеры подставляют автоматически, поэтому указывать их необязательно.
Самый удобный формат адресов – семантический. Он позволяет пользователям заранее понять, какая информация находится на странице, легко запоминается, может содержать ключевые фразы, облегчает навигацию по сайту. При создании URL-адреса для сайта следует придерживаться ряда правил, с которыми можно ознакомиться в справочном центре Google.
Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: