Лекции по информатике

1d622a11

Основные сервисы системы Интернет


World Wide Web (WWW, “Всемирная паутина”) — основной инструмент Интернет, её главный информационный сервис.

World Wide Web (WWW, “Всемирная паутина”) — гипертекстовая, а точнее, гипермедийная информационная система поиска ресурсов Интернет и доступа к ним.

Гипертекст — информационная структура, позволяющая устанавливать смысловые связи между элементами текста на экране компьютера таким образом, чтобы можно было легко осуществлять переходы от одного элемента к другому. На практике в гипертексте некоторые слова выделяют путем подчёркивания или окрашивания в другой цвет. Выделение слова говорит о наличии связи этого слова с некоторым документом, в котором тема, связанная с выделенным словом, рассматривается более подробно.

Гипермедиа — это то, что получится, если в определении гипертекста заменить слово “текст” на “любые виды информации”: звук, графику, видео. Такие гипермедийные ссылки возможны, поскольку наряду с текстовой информацией можно связывать и любую другую двоичную информацию, например, закодированный звук или графику, Так, если программа отображает карту мира и если пользователь выбирает на этой карте с помощью мыши какой-либо континент, программа может тут же дать о нём графическую, звуковую и текстовую информацию.

Система WWW

построена на специальном протоколе передачи данных, который называется протоколом передачи гипертекста HTTP (читается “эйч-ти-ти-пи”, HyperText Transfer Protocol).

Всё содержимое системы WWW



состоит из WWW-страниц, называемых сайтами (англ. site — участок).

WWW-cтраницы (cайты) — гипермедийные документы системы World Wide Web. Создаются с помощью языка разметки гипертекста HTML (Hypertext markup language).

Язык HTML позволяет добавлять к текстовым документам специальные командные фрагменты — тэги (англ. tag

— "этикетка, ярлык") таким образом, что становится возможным связывать с этими документами другие тексты, графику, звук и видео, задавать заголовки различных уровней, разделять текст на абзацы, строить таблицы и т.д.
Например, заголовок документа может иметь такой вид: <TITLE> Клуб любителей персиков </TITLE>

Одну WWW-страницу на самом деле обычно составляет набор гипермедийных документов, расположенных на одном сервере, переплетённых взаимными ссылками и связанных по смыслу

(например, содержащих информацию об одном учебном заведении или об одном музее). Каждый документ страницы, в свою очередь, может содержать несколько экранных страниц текста и иллюстраций. Каждая WWW-страница имеет свой “титульный лист” (англ. “homepage”) — гипермедийный документ, содержащий ссылки на главные составные части страницы. Адреса “титульных листов” распространяются в Интернет в качестве адресов страниц.



Личные страницы — такие WWW-страницы, которые принадлежат не фирмам и не организациям, а отдельным людям. Содержание и оформление такой страницы зависит только от её автора.

При работе с системой WWW

пользователи имеют дело с программами-клиентами системы, называемыми браузерами.



Браузеры (англ. browse — листать, просматривать) — программы, с помощью которых пользователь организует диалог с системой WWW: просматривает WWW страницы, взаимодействует с WWW-cерверами и другими ресурсами в Интернет.

Существуют сотни программ-браузеров. Самые популярные браузеры: Netscape Navigator и Microsoft Explorer.

Браузеры WWW умеют взаимодействовать с любыми типами серверов, используя при этом их собственные протоколы. Информацию, полученную от любого сервера, браузер WWW выводит на экран в стандартной, удобной для восприятия форме. При этом переключения с одного протокола на другой для пользователя часто остаются незамеченными.

Программа удалённого доступа Telnet. Позволяет входить в другую вычислительную систему, работающую в Интернет, с помощью протокола TELNET. Эта программа состоит из двух компонент: программы-клиента, которая выполняется на компьютере-клиенте, и программы-сервера, которая выполняется на компьютере-сервере.

Функции программы-клиента:

  • установление соединения с сервером;




  • приём от абонента входных данных, преобразование их к стандартному формату и отсылка серверу;


  • приём от сервера результатов запроса в стандартном формате и переформатирование их в вид, удобный клиенту.


  • Функции программы-сервера:

    • ожидание запроса в стандартной форме;


    • обслуживание этого запроса;


    • отсылка результатов программе-клиенту.


    • Telnet — простое и поэтому универсальное средство связи в Интернет.

      Программа пересылки файлов Ftp. Перемещает копии файлов с одного узла Интернет на другой в соответствии с протоколом FTP (File Transfer Protocol — “протокол передачи файлов”). При этом не имеет значения, где эти узлы расположены и как соединены между собой.

      Компьютеры, на которых есть файлы для общего пользования, называются FTP-серверами. В Интернет имеется более 10 Терабайт бесплатных файлов и программ.

      Электронная почта (Electronic mail, англ. mail — почта, сокр. E-mail, читается “и-мэйл”). Служит для передачи текстовых сообщений в пределах Интернет, а также между другими сетями электронной почты. К тексту письма современные почтовые программы позволяют прикреплять звуковые и графические файлы, а также двоичные файлы — программы.

      При использовании электронной почты каждому абоненту присваивается уникальный почтовый адрес, формат которого имеет вид: <имя пользователя> @ < имя почтового сервера>. Например: earth@space.com, где earth — имя пользователя, space.com — имя компьютера, @ — разделительный символ “эт коммерческое”.

      Сообщения, поступающие по E-Mail, хранятся в специальном “почтовом” компьютере в выделенной для получателя области дисковой памяти (его “почтовом ящике”), откуда он может их выгрузить и прочитать с помощью специальной программы-клиента.

      Для отсылки сообщения нужно знать электронный адрес абонента. При качественной связи электронное письмо доходит в любую точку мира в течение нескольких минут.

      Пользователи электронной почты стремятся придерживаться правил сетевого этикета (нэтикета), а для выражения эмоций используют схематические изображения человеческого лица, так называемые смайлики (англ. smiley, “улыбочка”), некоторые из которых приведены ниже.



      Смайлики (рассматривайте, склонив голову влево)

      :-) улыбка

      :-))) хохот

      :-~) насморк

      :*) пьяница

      :-{) усатый

      :-[ вампир

      –:-) панк

      :-Q курит

      :-@ кричит

      :-( грусть

      :'-( плачет

      ;-) хитрец

      >:-( злится

      : 0 зевает

      :-)~ пускает слюнки

      8:-) маленькая девочка

      :-* cъел горькое

      :'-) плачет от счастья

      :-& поклялся молчать

      O-) аквалангист

      =8-) носит очки

      Cистема телеконференций Usenet (от Users Network). Эта система организует коллективные обсуждения по различным направлениям, называемые телеконференциями. В каждой телеконференции проводится ряд дискуссий по конкретным темам.

      Сегодня Usenet имеет более десяти тысяч дискуссионных групп (NewsGroups) или телеконференций, каждая из которых посвящена определённой теме и является средством обмена мнениями. Телеконференции разбиты на несколько групп:

      • news — вопросы, касающиеся системы телеконференций;


      • comp — компьютеры и программное обеспечение;


      • rec — развлечения, хобби и искусства;


      • sci — научно-исследовательская деятельность и приложения;


      • soc — социальные вопросы;


      • talk — дебаты по различным спорным вопросам;


      • misc — всё остальное.


      • Внутри этих категорий существует иерархия. Так, например, rec.music.beatles — это дискуссия о творчестве Битлз, входящая в подгруппу “музыка” группы дискуссий по искусству.

        Существует большой выбор программ чтения телеконференций, которые формируют материал дискуссий в упорядоченном виде и предоставляют в распоряжение корреспондентов.

        Аналог телеконференций в других сетях — “электронная доска объявлений” (Bulletin Board System, BBS).

        Системы информационного поиска сети Интернет

        В Интернет представлена информация на любые темы, которые только можно себе представить. Но найти в ней нужную информацию не так-то легко из-за того, что сеть по своей природе не имеет чёткой структуры. Поэтому для ориентировки в Интернет и быстрого получения свежей справочной информации разработаны системы поиска информации.

        Все системы поиска информации Интернет располагаются на специально выделенных компьютерах с мощными каналами связи.


        Ежеминутно они бесплатно обслуживают огромное количество клиентов.

        Поисковые системы можно разбить на два типа:

        • предметные каталоги, формируемые людьми-редакторами;


        • автоматические индексы, формируемые специальными компьютерными программами, без участия людей.


        • Системы, основанные на предметных каталогах. Используют базы данных, формируемые специалистами-редакторами, которые отбирают информацию, устанавливают связи для баз данных, организуют и снабжают данные в разных поисковых категориях перекрёстными ссылками. Кампании, владеющие предметными каталогами, непрерывно исследуют, описывают и каталогизируют содержимое WWW-cерверов и других сетевых ресурсов, разбросанных по всему миру.

          В результате этой работы клиенты Интернет имеют постоянно обновляющиеся иерархические (древовидные) каталоги, на верхнем уровне которых собраны самые общие категории, такие как “бизнес”, “наука”, “искусство” и т.п., а элементы самого нижнего уровня представляют собой ссылки на отдельные WWW-страницы и серверы вместе с кратким описанием их содержимого.

          Пример. Если нужно выяснить, какая в мире имеется информация о пище динозавров, достаточно спуститься по иерархии:

          Науки ==> Млекопитающие ==> Палеонтология ==> Динозавры ==> Пища.

          Каталоги, составленные людьми, более осмыслены, чем автоматические индексы. Их очень мало, так как их создание и поддержка требуют огромных затрат. Для примера рассмотрим самый популярный предметный каталог Yahoo!, который обладает одной из крупнейших баз данных. Имеет информационные базы для детей и подростков. Поддерживает два основных метода работы с каталогом — поиск по ключевым словам и поиск по иерархическому дереву разделов. Не принимает запросов на естественном языке.

          Автоматические индексы. Переоценить их трудно. Поиск по ключевым словам в одной базе данных, занимающий в худшем случае несколько секунд, принесёт те же результаты, что и обшаривание всех WWW-страниц во всей сети Интернет.

          Автоматический индекс состоит из трёх частей:



          • программы-робота;


          • базы данных, собираемой этим роботом;


          • интерфейса для поиска в этой базе, с которым и работает пользователь.


          • Все эти компоненты функционируют без вмешательства человека.

            К автоматическим индексам следует прибегать только тогда, когда ключевые слова точно известны, например, фамилия человека или несколько специфических терминов из соответствующей области. Индексы получают информацию из каждого отдельного узла, регистрируют и индексируют её и добавляют к своим базам данных.

            Среди известных индексов выделяется: AltaVista — одна из самых мощных полностью автоматических поисковых систем. Обладает полнотекстовой базой данных. Выдаёт наибольшее количество ссылок. Проиндексировано 30 млн. страниц с 300 тысяч серверов и 4 млн. статей из телеконференций Usenet. За один день AltaVista

            обслуживает около 20 млн. запросов.

            В Интернет один и тот же узел сети может одновременно работать по нескольким протоколам. Поэтому крупные узлы сети сейчас обладают полным набором серверов, и к ним можно обращаться почти по любому из существующих протоколов.


            Содержание раздела