Это вводный урок для новичков SEO, которые не знакомы с принципами работы Интернета и веб-сайтов. Оптимизаторы поисковых систем с четким представлением Интернет-технологий смогут понять множество технических процессов, которые помогут диагностировать неполадки по SEO. Техническое определение Интернета
Давайте начнем с основного урока о Интернет-технологиях. Интернет – это сеть огромного числа компьютеров. Компьютеры соединены либо посредством проводной связи (через кабели), либо посредством беспроводной связи (антенны).
Каждому компьютеру в Интернете присвоено имя, которое идентифицирует его как «уникального» в сети. Это называется IP адрес. Пример IP адреса - 209.35.17.17. Это договоренность присваивания числового имени компьютеру; эта договоренность существует с момента зарождения Интернета.
Используя IP адрес, вы можете установить следующую информацию:
Поставщик интернет-услуг компьютера
Географическое местоположение компьютера.
Например, вы можете использовать следующую сервисную программу для определения IP адреса вашего компьютера в Интернете: http://www.whatismyip.com/
Зная свой IP адрес, вы можете ввести результат в http://ip-lookup.net/. Эта программа сообщит вам имя хоста вашего провайдера и вашу страну. Поэтому процесс разработки сайта лучше сразу доверить профессионалам.
Причина, по которой Google знает точное географическое местоположение веб-серверов, - IP адрес сервера.
Итак, что такое Интернет-провайдер? Их основная работа – обеспечивать Интернет-соединения своим абонентам. В свою очередь, абоненты вносят ежемесячную плату для поддержания своего Интернет-соединения.
Для ускорения процесса, особенно если у Интернет-провайдера большое число абонентов, использующих соединения одновременно, Интернет-провайдер приобретает собственный DNS-сервер (сервер доменных имён). DNS-сервер фактически работает как «кэш-память» - временное хранилище системных эквивалентов «IP адресов для доменного имени».
Так как Интернет – это сеть компьютеров, каждый их которых имеет свой IP адрес, веб-сайты используют псевдоним, известный как «доменное имя» вместо IP, чтобы облегчить пользователям запоминание (проще запомнить слово, чем число).
DNS-сервер используется для преобразования этих доменных имен в эквиваленты их IP адресов. Итак, DNS-сервер содержит следующую информацию (например):
Доменное имя = IP адрес
seochat.com === 209.35.17.17
ibm.com === 129.42.38.1
apple.com === 17.251.200.70
Интернет-протокол TCP/IP передает информацию посредством чисел и битов, одна часть информации, используемая в обмене информацией, - это IP адрес. Поэтому, когда браузер пользователя посещает веб-сайт, DNS-сервер Интернет-провайдера переводит запрос доменного имени в IP адрес в целя передачи информации.
Сервер доменных имён хостинга
Каждый веб-сайт в Интернете хранится в компьютере (таком, каким вы пользуетесь дома). Эти компьютеры соединены и идентифицированы в Интернете посредством IP адреса (основной протокол описывался выше). Так как веб-сайты используют доменное имя вместо IP адреса, «сервер доменных имён» хранит сообщения из авторитетных источников относительно IP адреса веб-сайта (известного как A-Record) и почтовой записи (MX record). Некоторые используемые записи – это CNAME и другие.
Если вы обновляете сервер доменных имён, информация о веб-сайте (его IP адрес и т.д.) будет «распространена» по Интернету, достигнув всех возможных DNS-серверов разных Интернет-провайдеров. Этот процесс, называемый «DNS-распространение», может занять 48 часов. Вот почему веб-разработчики часто советуют оптимизаторам поисковых систем начинать работу над сайтом после полного завершения обновления DNS.
Как только у DNS-сервера появляется эта информация, она храниться в компьютере. Если клиент запрашивает конкретный веб-сайт с DNS-сервера, сервер проверит его эквивалентный IP адрес, чтобы перенести контент с хост-сервера.
По этому вопросу мы предусмотрели следующее (показано на информационных диаграммах):
Стрелка, идущая от DNS Интернет-провайдера к Серверу доменных имён веб-сайтов и наоборот означает, что DNS-сервер извлекает/обновляет информацию об IP адресе веб-сайта и т.д. Информация помещается в кэш-память DNS-сервера на некоторое время.
Это немного ускоряет обмен информацией, как говорилось ранее. Если веб-сёрфер посылает запрос о домене, у DNS есть эта информация в кэш-памяти и он может оперативно передать ее дальше для извлечения контента веб-сайта (будет обсуждаться в следующей главе).
Запись на сервере доменных имён формируется, используя панель управления регистратора вашего домена. Два самых популярных регистратора - Go Daddy и Network Solutions. Итак, если вы регистрируете доменное имя у регистратора и у вас есть хостинг-аккаунт для вашего веб-сайта, компания по предоставлению услуг веб-хостинга предоставит вам информацию о своем сервере доменных имён.
Примеры серверов доменных имён:
NS1.AGILITYHOSTER.COM
NS2.AGILITYHOSTER.COM
Если вы получили информацию о сервере доменных имён от вашей компании по предоставлению услуг веб-хостинга, вам необходимо будет обновить эту информацию у своего регистратора домена. Если вы переходите к другой компании по предоставлению услуг веб-хостинга, вам также необходимо будет обновить сервер доменных имён на панели управления регистратора вашего домена.
Уроки Интернет-технологий по SEO - Выборка контента веб-сайта с веб-сервера
Так как на DNS-сервере хранятся записи сервера доменных имён для всех веб-сайтов в Интернете, каждый раз, когда пользователь посещает веб-сайт, Интернет-провайдер знает, откуда извлекать контент веб-сайта – потому что запись сервера доменных имён содержит адрес компании по предоставлению услуг веб-хостинга для этого конкретного сайта и IP адрес веб-сайта.
Далее он свяжется с хостинг-сервером веб-сайта, запросив контент. Если информация найдется на сервере веб-сайта, обратно придет статус 200 OK с контентом – в противном случае, если не найдется, придет статус 404. Если какая-либо ошибка на сервере, то в ответ придет статус 500. Вероятно, вы встречали эти распространенные ошибки при посещении веб-сайтов.
Как только вы получили контент, ваш браузер выведет исходный код HTML (полученный с хостинг-сервера веб-сайта), чтобы вы могли правильно прочесть контент.
Веб-сервер также может быть настроен таким образом, чтобы доставлять контент в зависимости от запрашивающей стороны. Запрашивающая сторона также может быть определена по ее IP адресу и DNS-серверу. Вот почему, когда веб-сайт подвергается нападению хакеров, администратор веб-сайта может отследить хакера, посмотрев на журнал регистрации сервера и получив IP адреса злоумышленников.
Одним SEO злоупотреблением является «маскировка». Она состоит в предоставлении контента в зависимости от посетителя, делающего запрос. Это распространено для взломанных веб-сайтов – хакер может настроить веб-сайт так, чтобы он возвращал контент о Виагре на запрос робота Googlebot, и в то же время предоставлять нормальную информацию обычным посетителям.
К счастью, вы можете диагностировать эту проблему, используя программу «Fetch as Googlebot» в Google Webmaster Tools. Она симулирует то, что видит Google при посещении роботом Googlebot вашего сервера веб-сайта и затем извлекает контент так, чтобы вы смогли проанализировать, был ли он видоизменен или нет.
Ниже приводится конечная диаграмма, изображающая, как работает Интернет, от запроса клиента у веб-сервера, тогда как DSN преобразовывает доменные имена в IP адреса. Она также отображает присутствие робота Googlebot в данном процессе:
Google имеет свои DNS-серверы, http://code.google.com/speed/public-dns/docs/intro.html, которые сейчас общедоступны. Вы даже можете использовать их для замены DNS-сервера своего Интернет-провайдера на более скоростной браузинг (просматривание страниц), особенно если DNS-сервер вашего Интернет-провайдера перегружен или кажется вам медленным.
Что такое блоки адресов IP класса С?
Иногда, при совместном пользовании хостингом, многие веб-сайты используют в качестве ведущего узла единый блок адресов IP класса С. Например, как в этом IP адресе: 209.35.17.17, блок адресов IP класса С это: 209.35.17
Значимость этого в том, что очень тяжело иметь множество IP адресов в разных классах С, если для всех своих веб-сайтов вы используете один хостинг-сервер (http://www.soulcast.com/post/show/408636/Importance-of-Class-C-IP-address-for-SEO)
Этот факт принимается во внимание поисковыми машинами для обнаружения спама, поэтому если тысячи обратных ссылок приходят со следующих IP адресов:
121.3.45.2
121.3.45.100
121.3.45.89
121.3.45.65
121.3.45.71
и т.д., то поисковым машинам понятно, что все они происходят от одного блока адресов IP класса С, и следовательно вышеприведенная серия IP адресов может приниматься за один вместо 1000 +.
Весьма дорого выполнять роль ведущего узла для многих веб-сайтов на хостинг-сервере р разными IP адресами класса С, что можно понять лишь взглянув на некоторые хостинг-пакеты: http://www.page1hosting.com/packages.html.