2.27. Что такое сеть Интернет и как она работает?

Интернет (англ. Internet - между сетей) - гигантская всемирная компьютерная сеть, объединяющая десятки тысяч сетей всего мира. Её назначение - обеспечить любому желающему постоянный доступ к любой информации. Интернет предлагает практически неограниченные информационные ресурсы, полезные сведения, учёбу, развлечения, возможность общения с компетентными людьми, услуги удалённого доступа, передачи файлов, электронной почты и многое другое. Интернет обеспечивает принципиально новый способ общения людей, не имеющий аналогов в мире.

Благодаря сети стал доступен (бесплатно или за умеренную плату) огромный объём информации. Так, пользователь в любой стране может связаться с людьми, разделяющими его интересы, или получить ценные сведения в электронных библиотеках, даже если они находятся на другом конце света.

Нужная информация окажется в его компьютере за считанные секунды, пройдя путь по длинной цепочке промежуточных компьютеров, по кабелям и по радио, через горы и моря, по дну океана и через спутник.

Интернет финансируется правительствами, научными и образовательными учреждениями, коммерческими структурами и миллионами частных лиц во всех частях света, но никто конкретно не является её владельцем. Управляет сетью "Совет по архитектуре Интернет", формируемый из приглашённых добровольцев.

Сеть была создана в 1984 году, и сейчас ею пользуются примерно сорок миллионов человек. Интернет всё время изменяется, поскольку имеет много квалифицированных пользователей, которые пишут программы для себя, а затем распространяют их среди желающих. Постоянно появляются новые серверы, а существующие обновляют свой "репертуар". Стремительно растут информационные потоки.

Как можно связаться с Интернет? Самый распространенный и недорогой способ - посредством модема и телефонной линии. При этом используются три типа подключения, отличающиеся друг от друга по объёму услуг и цене:

    1. почтовое - позволяет только обмениваться электронной почтой с любым пользователем Интернет, самое дешёвое;
    2. сеансное в режиме on-line ("на прямом проводе") - работа в диалоговом режиме - все возможности сети на время сеанса;
    3. прямое (личное), самое дорогостоящее - все возможности в любое время.


При работе в сеансном режиме доступ к Интернет обычно покупается у провайдеров (англ. provide - предоставлять, обеспечивать) - фирм, предоставляющих доступ к некоторой части Интернет и поставляющих её пользователям разнообразные услуги.
Как связываются между собой сети в Интернет?
Отдельные участки Интернет представляют собой сети различной архитектуры, которые связываются между собой с помощью маршрутизаторов. Передаваемые данные разбиваются на небольшие порции, называемые пакетами. Каждый пакет перемещается по сети независимо от других пакетов.

Сети в Интернет неограниченно коммутируются (т.е. связываются) друг с другом, потому что все компьютеры, участвующие в передаче данных, используют единый протокол коммуникации TCP/IP (читается "ти-си-пи/ай-пи").

На самом деле протокол TCP/IP - это два разных протокола, определяющих различные аспекты передачи данных в сети:

  •  
    • протокол TCP (Transmission Control Protocol) - протокол управления передачей данных, использующий автоматическую повторную передачу пакетов, содержащих ошибки; этот протокол отвечает за разбиение передаваемой информации на пакеты и правильное восстановление информации из пакетов получателя;
    • протокол IP (Internet Protocol) - протокол межсетевого взаимодействия, отвечающий за адресацию и позволяющий пакету на пути к конечному пункту назначения проходить по нескольким сетям.

Схема передачи информации по протоколу TCP/IP такова: протокол ТСР разбивает информацию на пакеты и нумерует все пакеты; далее с помощью протокола IP все пакеты передаются получателю, где с помощью протокола ТСР проверяется, все ли пакеты получены; после получения всех пакетов протокол ТСР располагает их в нужном порядке и собирает в единое целое.

Каким образом пакет находит своего получателя?

Каждый компьютер, подключенный к сети Интернет имеет два равноценных уникальных адреса: цифровой IP-адрес и символический доменный адрес. Присваивание адресов происходит по следующей схеме: международная организация Сетевой информационный центр выдает группы адресов владельцам локальных сетей, а последние распределяют конкретные адреса по своему усмотрению.

IP-адрес компьютера имеет длину 4 байта. Обычно первый и второй байты определяют адрес сети, третий байт определяет адрес подсети, а четвертый - адрес компьютера в подсети. Для удобства IP-адрес записывают в виде четырех чисел со значениями от 0 до 255, разделенных точками, например: 145.37.5.150. Адрес сети - 145.37; адрес подсети - 5; адрес компьютера в подсети - 150.

Доменный адрес (англ. domain - область), в отличие от цифрового, является символическим и легче запоминается человеком. Пример доменного адреса: barsuk.les.nora.ru. Здесь домен barsuk - имя реального компьютера, обладающего IP-адресом, домен les - имя группы, присвоившей имя этому компьютеру, домен nora - имя более крупной группы, присвоившей имя домену les, и т.д. В процессе передачи данных доменный адрес преобразуются в IP-адрес. Механизм такого преобразования подробно описан в [54].


Основные сервисы системы Интернет.
World Wide Web (WWW, "Всемирная паутина") - основной инструмент Интернет, её главный информационный сервис.

World Wide Web (WWW, "Всемирная паутина") - гипертекстовая, а точнее, гипермедийная информационная система поиска ресурсов Интернет и доступа к ним.

Гипертекст - информационная структура, позволяющая устанавливать смысловые связи между элементами текста на экране компьютера таким образом, чтобы можно было легко осуществлять переходы от одного элемента к другому. На практике в гипертексте некоторые слова выделяют путем подчёркивания или окрашивания в другой цвет. Выделение слова говорит о наличии связи этого слова с некоторым документом, в котором тема, связанная с выделенным словом, рассматривается более подробно.

Гипермедиа - это то, что получится, если в определении гипертекста заменить слово "текст" на "любые виды информации": звук, графику, видео. Такие гипермедийные ссылки возможны, поскольку наряду с текстовой информацией можно связывать и любую другую двоичную информацию, например, закодированный звук или графику, Так, если программа отображает карту мира и если пользователь выбирает на этой карте с помощью мыши какой-либо континент, программа может тут же дать о нём графическую, звуковую и текстовую информацию.

Система WWW построена на специальном протоколе передачи данных, который называется протоколом передачи гипертекста HTTP (читается "эйч-ти-ти-пи", HyperText Transfer Protocol).

Всё содержимое системы WWW состоит из WWW-страниц, называемых сайтами (англ. site - участок).

WWW-cтраницы (cайты) - гипермедийные документы системы World Wide Web. Создаются с помощью языка разметки гипертекста HTML (Hypertext markup language).

Язык HTML позволяет добавлять к текстовым документам специальные командные фрагменты - тэги (англ. tag - "этикетка, ярлык") таким образом, что становится возможным связывать с этими документами другие тексты, графику, звук и видео, задавать заголовки различных уровней, разделять текст на абзацы, строить таблицы и т.д. Например, заголовок документа может иметь такой вид: <TITLE> Клуб любителей персиков </TITLE>

Одну WWW-страницу на самом деле обычно составляет набор гипермедийных документов, расположенных на одном сервере, переплетённых взаимными ссылками и связанных по смыслу (например, содержащих информацию об одном учебном заведении или об одном музее). Каждый документ страницы, в свою очередь, может содержать несколько экранных страниц текста и иллюстраций. Каждая WWW-страница имеет свой "титульный лист" (англ. "homepage") - гипермедийный документ, содержащий ссылки на главные составные части страницы. Адреса "титульных листов" распространяются в Интернет в качестве адресов страниц.

Личные страницы - такие WWW-страницы, которые принадлежат не фирмам и не организациям, а отдельным людям. Содержание и оформление такой страницы зависит только от её автора.

При работе с системой WWW пользователи имеют дело с программами-клиентами системы, называемыми браузерами.

Браузеры (англ. browse - листать, просматривать) - программы, с помощью которых пользователь организует диалог с системой WWW: просматривает WWW страницы, взаимодействует с WWW-cерверами и другими ресурсами в Интернет.

Существуют сотни программ-браузеров. Самые популярные браузеры: Netscape Navigator и Microsoft Explorer.

Браузеры WWW умеют взаимодействовать с любыми типами серверов, используя при этом их собственные протоколы. Информацию, полученную от любого сервера, браузер WWW выводит на экран в стандартной, удобной для восприятия форме. При этом переключения с одного протокола на другой для пользователя часто остаются незамеченными.

Программа удалённого доступа Telnet. Позволяет входить в другую вычислительную систему, работающую в Интернет, с помощью протокола TELNET. Эта программа состоит из двух компонент: программы-клиента, которая выполняется на компьютере-клиенте, и программы-сервера, которая выполняется на компьютере-сервере.

Функции программы-клиента:

  •  
    • установление соединения с сервером;
    • приём от абонента входных данных, преобразование их к стандартному формату и отсылка серверу;
    • приём от сервера результатов запроса в стандартном формате и переформатирование их в вид, удобный клиенту.

Функции программы-сервера

:

  •  
    • ожидание запроса в стандартной форме;
    • обслуживание этого запроса;
    • отсылка результатов программе-клиенту.

Telnet - простое и поэтому универсальное средство связи в Интернет.

Программа пересылки файлов Ftp. Перемещает копии файлов с одного узла Интернет на другой в соответствии с протоколом FTP (File Transfer Protocol - "протокол передачи файлов"). При этом не имеет значения, где эти узлы расположены и как соединены между собой.

Компьютеры, на которых есть файлы для общего пользования, называются FTP-серверами. В Интернет имеется более 10 Терабайт бесплатных файлов и программ.

Электронная почта (Electronic mail, англ. mail - почта, сокр. E-mail, читается "и-мэйл"). Служит для передачи текстовых сообщений в пределах Интернет, а также между другими сетями электронной почты. К тексту письма современные почтовые программы позволяют прикреплять звуковые и графические файлы, а также двоичные файлы - программы.

При использовании электронной почты каждому абоненту присваивается уникальный почтовый адрес, формат которого имеет вид: <имя пользователя> @ < имя почтового сервера>. Например: earth@space.com, где earth - имя пользователя, space.com - имя компьютера, @ - разделительный символ "эт коммерческое".

Сообщения, поступающие по E-Mail, хранятся в специальном "почтовом" компьютере в выделенной для получателя области дисковой памяти (его "почтовом ящике"), откуда он может их выгрузить и прочитать с помощью специальной программы-клиента.

Для отсылки сообщения нужно знать электронный адрес абонента. При качественной связи электронное письмо доходит в любую точку мира в течение нескольких минут.

Пользователи электронной почты стремятся придерживаться правил сетевого этикета (нэтикета), а для выражения эмоций используют схематические изображения человеческого лица, так называемые смайлики (англ. smiley, "улыбочка"), некоторые из которых приведены ниже.

Смайлики (рассматривайте, склонив голову влево)
:-) улыбка
:-)))
хохот
:-~)
насморк
:*)
пьяница
:-{)
усатый
:-[
вампир
-:-)
панк
:-Q курит
:-@
кричит
:-(
грусть
:'-(
плачет
;-)
хитрец
>:-(
злится
: 0
зевает
:-)~ пускает слюнки
8:-)
маленькая девочка
:-*
cъел горькое
:'-)
плачет от счастья
:-&
поклялся молчать
O-)
аквалангист
=8-)
носит очки

Cистема телеконференций Usenet (от Users Network). Эта система организует коллективные обсуждения по различным направлениям, называемые телеконференциями. В каждой телеконференции проводится ряд дискуссий по конкретным темам.

Сегодня Usenet имеет более десяти тысяч дискуссионных групп (NewsGroups) или телеконференций, каждая из которых посвящена определённой теме и является средством обмена мнениями. Телеконференции разбиты на несколько групп:

  •  
    • news - вопросы, касающиеся системы телеконференций;
    • comp - компьютеры и программное обеспечение;
    • rec - развлечения, хобби и искусства;
    • sci - научно-исследовательская деятельность и приложения;
    • soc - социальные вопросы;
    • talk - дебаты по различным спорным вопросам;
    • misc - всё остальное.

Внутри этих категорий существует иерархия. Так, например, rec.music.beatles - это дискуссия о творчестве Битлз, входящая в подгруппу "музыка" группы дискуссий по искусству.

Существует большой выбор программ чтения телеконференций, которые формируют материал дискуссий в упорядоченном виде и предоставляют в распоряжение корреспондентов.

Аналог телеконференций в других сетях - "электронная доска объявлений" (Bulletin Board System, BBS).

Системы информационного поиска сети Интернет

В Интернет представлена информация на любые темы, которые только можно себе представить. Но найти в ней нужную информацию не так-то легко из-за того, что сеть по своей природе не имеет чёткой структуры. Поэтому для ориентировки в Интернет и быстрого получения свежей справочной информации разработаны системы поиска информации.

Все системы поиска информации Интернет располагаются на специально выделенных компьютерах с мощными каналами связи. Ежеминутно они бесплатно обслуживают огромное количество клиентов.

Поисковые системы можно разбить на два типа:

  •  
    • предметные каталоги, формируемые людьми-редакторами;
    • автоматические индексы, формируемые специальными компьютерными программами, без участия людей.

Системы, основанные на предметных каталогах. Используют базы данных, формируемые специалистами-редакторами, которые отбирают информацию, устанавливают связи для баз данных, организуют и снабжают данные в разных поисковых категориях перекрёстными ссылками. Кампании, владеющие предметными каталогами, непрерывно исследуют, описывают и каталогизируют содержимое WWW-cерверов и других сетевых ресурсов, разбросанных по всему миру. В результате этой работы клиенты Интернет имеют постоянно обновляющиеся иерархические (древовидные) каталоги, на верхнем уровне которых собраны самые общие категории, такие как "бизнес", "наука", "искусство" и т.п., а элементы самого нижнего уровня представляют собой ссылки на отдельные WWW-страницы и серверы вместе с кратким описанием их содержимого.

Пример. Если нужно выяснить, какая в мире имеется информация о пище динозавров, достаточно спуститься по иерархии:


Науки ==> Млекопитающие ==> Палеонтология ==> Динозавры ==> Пища.
Yahoo!Каталоги, составленные людьми, более осмыслены, чем автоматические индексы. Их очень мало, так как их создание и поддержка требуют огромных затрат. Для примера рассмотрим самый популярный предметный каталог Yahoo!, который обладает одной из крупнейших баз данных. Имеет информационные базы для детей и подростков. Поддерживает два основных метода работы с каталогом - поиск по ключевым словам и поиск по иерархическому дереву разделов. Не принимает запросов на естественном языке.

Автоматические индексы. Переоценить их трудно. Поиск по ключевым словам в одной базе данных, занимающий в худшем случае несколько секунд, принесёт те же результаты, что и обшаривание всех WWW-страниц во всей сети Интернет.

Автоматический индекс состоит из трёх частей:

  •  
    • программы-робота;
    • базы данных, собираемой этим роботом;
    • интерфейса для поиска в этой базе, с которым и работает пользователь.

Все эти компоненты функционируют без вмешательства человека.

К автоматическим индексам следует прибегать только тогда, когда ключевые слова точно известны, например, фамилия человека или несколько специфических терминов из соответствующей области. Индексы получают информацию из каждого отдельного узла, регистрируют и индексируют её и добавляют к своим базам данных.

Среди известных индексов выделяется: AltaVista - одна из самых мощных полностью автоматических поисковых систем. Обладает полнотекстовой базой данных. Выдаёт наибольшее количество ссылок. Проиндексировано 30 млн. страниц с 300 тысяч серверов и 4 млн. статей из телеконференций Usenet. За один день AltaVista обслуживает около 20 млн. запросов.

В Интернет один и тот же узел сети может одновременно работать по нескольким протоколам. Поэтому крупные узлы сети сейчас обладают полным набором серверов, и к ним можно обращаться почти по любому из существующих протоколов.

Другие записи

10.06.2016. 2.2. Как устроен компьютер?
Разнообразие современных компьютеров очень велико. Но их структуры основаны на общих логических принципах, позволяющих выделить в любом компьютере следующие главные устройства:   память (запоминающее…
10.06.2016. 2.3. На каких принципах построены компьютеры?
В основу построения подавляющего большинства компьютеров положены следующие общие принципы, сформулированные в 1945 г. американским ученым Джоном фон Нейманом. Рис. 2.2. Джон фон Нейман, 1945 г. 1.…
10.06.2016. 2.4. Что такое команда? 2.5. Как выполняется команда?
Команда - это описание элементарной операции, которую должен выполнить компьютер. В общем случае, команда содержит следующую информацию:   код выполняемой операции; указания по определению…
10.06.2016. 2.14. Что такое видеосистема компьютера?
Видеосистема компьютера состоит из трех компонент:   монитор (называемый также дисплеем); видеоадаптер; программное обеспечение (драйверы видеосистемы). Видеоадаптер посылает…
10.06.2016. 2.15. Что такое принтер, плоттер, сканер?
Принтер - печатающее устройство. Осуществляет вывод из компьютера закодированной информации в виде печатных копий текста или графики. Существуют тысячи наименований принтеров. Но основных видов принтеров…