530 likes | 901 Views
Фундаментальные основы Интернет. Протоколы межсетевого обмена Принципы адресации в Интернет Службы и сервисы Интернет Принципы доступа к сетевой информации Основы гипертекствых технологий. Интернет – это сеть сетей. UNIXware. MS Networking. Сеть m. Сеть 1. И Н Т Е Р Н Е Т. IBM SNA.
E N D
Фундаментальные основы Интернет Протоколы межсетевого обмена Принципы адресации в Интернет Службы и сервисы Интернет Принципы доступа к сетевой информации Основы гипертекствых технологий
Интернет – это сеть сетей UNIXware MS Networking Сеть m Сеть 1 И Н Т Е Р Н Е Т IBM SNA Novell Netware Сеть n Сеть k Рис.1
Проблема совместимостипрограммных, информационных и технических ресурсов Сети решается путем применения всеми участниками межсетевого обмена специальных правил, процедур и соглашений – протоколов. Формализованные правила, определяющие последовательность и формат сообщений которыми обмениваются сетевые компоненты, называются протоколами.
Прикладной Прикладной 7 7 6 6 Представительный Представительный 5 5 Сеансовый Сеансовый 4 4 Транспортный Транспортный Сетевой Сетевой 3 3 2 2 Канальный Канальный Физический Физический 1 1 Горизонтальная составляющая эталонной модели OSI * Разбиение на пакеты * Сборка пакетов 2 1 3 Определение: Процесс вложения данных более высокого уровня в пакеты нижнего уровня называется инкапсуляцией Сеть передачи данных
Отличие протокола от интерфейса заключается в том, что протокол определяет правила взаимодействия компонент одинаковых уровней разных узлов сети, в то время, как интерфейс определяет правила взаимодействия смежных уровней одного узла. Согласованный набор протоколов и интерфейсов разных уровней, достаточный для организации межсетевого взаимодействия, называется стеком протоколов. • Наиболее распространенные сетевые протоколы (стеки): • TCP/IP – Internet; • IPX/SPX - Novell; • NetBios (SMB) - Microsoft
Приложений 7 6 Представительный Прикладной 5 1 Сеансовый OSI TCP/IP 4 Транспортный Транспортный 2 Сетевой 3 Канальный 2 Сетевой Физический 3 1 4 Соединения Стек TCP/IP является упрощенной, адаптированной для сети Интернет модификацией семиуровневой модели OSI. • Стек TCP/IP состоит из 4-х уровней: • Прикладной (приложений) • Транспортный • Сетевой • Уровень соединения
HTTP FTP SMTP POP NNTP TCP UDP Прикладной уровень IP RIP, OSPF,… Транспортный уровень Ethernet, Token Ring, PPP, … Сетевой уровень Физический уровень Структура стека протоколов TCP/IP Протоколы
Прикладной уровень Отвечает за обмен данными различныхформатов и включает протоколысодержательной обработки данных. Транспортный уровень Отвечает за установку связи между серверами Internet, осуществляет гарантированную доставку пакетов получателю. Сетевой уровень Обеспечивает передачу информации смежными узлами Сети. (маршрутизация) Уровень соединений Отвечает за целостность передачи данных между двумя соседними устройствами в Сети.
Получатель Специализированный маршрутизатор Получатель Коммутатор Транспортн. Прикладной Сетевой Транспортн. Соединения Сетевой Коммутатор Соединения Сетевой Рабочая станция/сервер Соединения Маршрутизатор Специализированный маршрутизатор Сервер-маршрутизатор Транспортн. Сетевой Прикладной Отправитель Соединения Отправитель Транспортн. Прикладной Сетевой Транспортн. Соединения Сетевой Соединения КАК ЭТО ВСЕ РАБОТАЕТ
Уровни абстракции сетевых объектов: Процессы Сети Уровень абстракции Хосты 2. Принципы адресации в Интернет • Объекты, которые участвуют в межсетевом обмене: • Процессы • Хосты • Сети
Хост – это компьютер или любое другое активное сетевое оборудование которое (а) имеет уникальный сетевой адрес; (б) способно выполнять сетевые процессы. Сеть – это группа хостов, объединенная единойсредой и технологией передачи данных. Процесс – это, выполняемая по некоторому алгоритму, содержательная обработка информации.
Последовательность сетевых соединений Процесс-процесс 3 Хост-хост 1 Сеть-сеть 2
Процесс-процесс Прикладной 1 Транспортный Сеть-сеть 2 Сетевой 3 4 Соединения Хост-хост Соответствие уровней сетевых соединений стеку TCP/IP Протоколы TCP/IP Соединения
Каждый компьютер в сети TCP/IP имеет адреса трех уровней: • физический; • сетевой; • символьный. Физический или MAC-адрес (Media Access Control) – это адрес сетевого адаптерахоста, входящего в локальнуюсеть. • Для всех существующих технологий локальных сетей МАС-адрес имеет длину 6 байтов: • Старшие 3 байта – идентификатор фирмы производителя; • младшие 3 байта назначаются уникальным образом самим производителем. 00-00-01-В2-55-CF – производитель Ксерокс
Сетевой или IP-адрес, длиной 4 байта состоит из двух частей: 1. номера сети. 2. номера узла в этой сети. 192.168.2.7 – ip-адрес файлового сервера ITS-PUBLIC Символьный идентификатор – это специальным образом построеное имя, которое назначается сетевым администратором или группой администраторов и включает имя хоста, название организации, ее местоположение и т.д.
Процесс-процесс Символьные адреса Прикладной 1 Транспортный Сеть-сеть IP – адреса 2 Сетевой 3 4 Соединения Хост-хост MAC – адреса Соответствие уровней адресации стеку TCP/IP и соединениям Стек TCP/IP Соединения Адресация
Символьная идентификация – наиболее распространенный среди пользователей Интернет вид адресации. Система имен доменов (DNS) является частью идеологии Интернет и базируется на использовании специальным образом организованной базы имен. Является доминирующей системой символьной идентификации Интернет. Система имен доменов - это распределенная база данных, поддерживающая иерархическую систему имен для идентификации узлов в сети Internet. Служба DNS предназначена для автоматического поиска IP-адреса по известному символьному имени узла.
Домен - это централизованно администрируемая область пространства доменных имен системы Интернет, которая обслуживается набором серверов доменных имен (DNS-сервера). Доменное имя - это символьное имя, под которым регистрируются домены в Интернет. Распределенная база данных доменных имен располагается на специальных компьютерах – DNS-серверах. • DNS-сервер (сервер доменных имен) - это служба Сети, которая функционирует на одном или группе компьютеров и в задачи которой входит: • Поиск ip-адреса компьютера(хоста) по его имени (разрешение имени); • Поиск имени хоста по его ip-адресу (разрешение адреса); • Кеширование (буферизация) ip-адресов.
Зона домена .irk Зона домена .kiev Корневой домен Зона домена .ru Зона домена .ua 198.41.0.4 .kiev .msk .sgu .knteu .ua .kpi .mts .org .dp … … … … … 128.9.0.107 … .irk .com .org .net … … 195.230.10.2 142.18.2.5 212.113.0.5 98.212.51.3 … … 208.12.152.2 195.230.142.4 209.66.103.53 123.18.26.8 … … Структура распределенной базы данных доменных имен
Зона домена .ua Зона домена .kiev Корневой домен Зона домена .irk .ua .knteu .kiev .sgu 198.41.0.4 .dp .kpi .mts … … … … … .net .org .com … 128.9.0.107 .Ru 195.230.10.2 212.113.0.5 208.12.152.2 .Irk Кеш 195.230.142.4 209.66.103.53 ? 123.18.26.8 Web-сервер КНТЭУ 198.41.0.4 195.230.10.2 КАК ЭТО ВСЕ РАБОТАЕТ 195.230.142.4 ? ? ? 195.230.142.4
Web-страница Web-сервер Метод доступа домен Унифицированный указатель ресурсовURL (Uniform Resource Locator)- это специальная запись символического адреса объекта (ресурса) в Internet. http://www.isn-knteu.org.ua/index.shtm Посредством URL задается местонахождение ресурсаи метод доступа к нему
3. Службы и сервисы Интернет Модель «клиент-сервер В модели «клиент-сервер» один компьютер (сервер), всегда находится в активном состоянии в ожидании запросов других компьютеров (клиентов) на выполнение какой-либо вычислительной работы (доступ к данным, обработка запроса и т.д.). • представление (front-end) - реализует функции ввода и отображения данных; • обработка (business-logic) - объединяет чисто прикладные функции, характерные для предметной области; • хранение (resource manager) - управляет доступом к данным, контролирует целостность БД и т.д.
Web-сервер FTP-сервер Мэйл-сервер Сервер новостей Прикладной HTTP FTP SMTP POP NNTP Транспортный порты IP-пакеты Сервисы и службы прикладного уровня. Сервис служба TCP
Порт – специальная точка входа (адрес) транспортного уровня, который отвечает за доставку пакетов определенному протоколу прикладного уровня. • Некоторые стандартные порты: • 80 – гипертекстовый протокол (HTTP); • 21 – протокол передачи файлов (FTP); • 25 – протокол передачи почты (SMTP); • 110 – протокол чтения почты (POP); • 119 – протокол новостей (NNTP) Сервис – это базовая функция прикладного уровня, имеющая (a) один протокол; (б) один стандартный порт. Служба – это, построеннная на базе одного или нескольких сервисов сетевая информационная компонента, основанная на технологии «клиент-сервер». (эл. магазины, аукционы и т.п.)
4. Принципы доступа к сетевой информации • Функции поисковых сервисов WWW: • Сбор, накопление и поддержка в актуальном состоянииинформации о Сетевых ресурсах. • Прием, обработка запросов пользователей и выдачарезультатов. Поисковая система – это сервер или группа серверов,на которых функционирует поисковая машина и средстваактуализацииинформации о Сетевых ресурсах. Поисковый каталог – это, организованый в виде иерархической структуры, список ссылок на Сетевые ресурсы.
Локальногобазирования Сетевогобазирования Метапоисковые системы Поисковые системы Каталоги Глобальные Региональные Специализированные Локальные Классификация поисковых сервисов в WWW
Глобальные поисковые системы и каталоги содержатссылки на информационные ресурсы по всему адресному пространству Internet. • Google.com - поисковая система • List.ru - поисковый каталог • Yahoo.com - поисковый портал • Региональные поисковые системы и каталоги содержатссылки на информационные ресурсы по адресному пространству Internet, ограниченому некоторым регионом (Россия, Украина). • Search.aol.com - поисковая системакомпании AOL • Yandex.ru - поисковая система Рунет • www.meta-ukraine.com - поисковая система Уанет
Специализированные поисковые системы и каталоги содержат ссылки на информационные ресурсы из определенной предметной области (медицина, политика …) • softseek.com – поискпрограмм • ditto.com – поискграфических файлов • cnn.com – политика, новости • doctor.ru - медицина • Локальные поисковые системы и каталоги содержат ссылки на информационные ресурсы внутриконкретной организации и ее локальной сети. • rada.gov.ua – поискзаконодательных актов насерверах ВР Украины • 195.230.142.4/library – поисккниг в каталоге библиотеки КНТЭУ
Метапоисковые системы – это службы, которые не имеют собственных поисковых средств, а для поискаинформации прибегают к помощи одной или нескольких классических поисковых систем. Метапоисковые системы сетевого базирования – этосервера в Internet. (El.visti.net) Метапоисковые системы локального базирования – этоспециализированные программы, которые размещаютсяна компьютере пользователя и выполняют поиск в Сети,путем переадресации запроса на классические поисковые системы. (Copernic-2000)
Индексбазы данных Поисковая машина клиент Роботиндексировщик Пассивная актуализация web Webадмин. Активная актуализация Структура поисковой системы (ПС)
Клиент - это хост, с которого поступил запрос на поиск конкретного информационного ресурса. Поисковая машина - служит для трансляции запросаклиента в формальный запрос системы, поиска ссылоки выдачи результатов этого поиска пользователю. Индекс базы данных - основной массив данных ПС, служит для поиска адреса информационного ресурса. Является системообразующей компонентой ПС Робот-индексировщик - специальная программа длясканирования Интернети поддержания базы данныхиндекса в актуальном состоянии.
База URL Словари БД Слова Слова Слова Ссылки Ссылки Ссылки N URL Буш Буш Обама 1,2,5,10,525… 1,2,5,10,525… 1,2,5,10,525… 1 www.cnn.com/bush.htm 2 www.vesti.ru/index.htm Бин Ладен Бин Ладен iPad 1,3,5,3000,… 1,3,5,3000,… 1,3,5,3000,… Емкость индекса БД Емкость словаря … … … … 50000000 www.deti.ru/title.htm Кучма Windows Кучма 10,345,800,… 10,345,800,… 10,345,800,… Упрощенная структура индекса базы данных ПС
Размер индекса базы данных ПС – это количествоадресов ресурсов сети, ссылки на которые содержатсяв базе данных ПС. Размер словаря ПС – это количество слов, словосочетанийи фраз, которым поcтавлен в соответствие хотя-бы одинадрес из базы URL. Период обновления индекса БД – это среднее время междудвумя посещениями роботом индексировщиком одного итого же ресурса в Сети. Обучаемость – это свойство роботов-индексировшиковпроводить селективный отбор информационных ресурсов (устранение повторов, игнорирование “грязных” ресурсов и т.д)
5. Основы гипертекстовых технологий В основе World Wide Web (WWW) лежит понятие гипертекста. Впервые термин “гипертекст” предложил Теодор Нельсон на 20 конференции ACM в 1965 г.: … by 'hypertext' mean nonsequential writing - text that branches and allows choice to the reader, best read at an interactive screen. «… под гипертекстом понимается непоследовательная запись текста, когда от разветвляется, что позволяет читателю делать выбор для быстрого интерактивного чтения с экрана)…»
Принципы гипертекстовой организации информации заложил Ванневар Буш. В 1945 г. он разработал гипотетическую машину Memex, в которой предложил механизм перекресных ссылок для доступа к информации, аналогичный современному гипертексту. В Memex документы хранятся совместно с вспомогательными полями, описывающими некие ассоциативные связи информации. Гипертекст – это форма представления информации, когда совместно с содержательной составляющей в тексте хранятся: (а) адреса других частей текста; (б) метки, на которые ссылаются из других частей текста.
Линейный текст 1 2 3 4 5 Гипертекст ссылки метки
В линейном тексте переход от одной его части (страницы, фрагмента и т.д.) к другой происходит последовательно. Единственное средство быстрого доступа в линейном тексте – индексация. (например: оглавление книги) При гипертекстовой форме хранения содержательная информация снабжается вспомогательными полями, которые позволяют осуществлять прямой переход на необходимый фрагмент по ссылке на него. Необходимым условием перехода является наличие метки. Метки и ссылки – невидимые, вспомогательные поля гипертекста
Ресурсы 1-го уровня … Ресурсы 2-го уровня … … Ресурсы 3-го уровня … Модели структурирования информации в Internet Иерархическая (древовидная). Заключается в организации информационных связей в виде упорядоченного дерева.
Древовидная организация информации получила свою практическую реализацию в системе Gopher(1989 г.), которая до 1995 г. являлась наиболее распространенной информационной технологией в Сети. Объединение Gopher-серверов называется gopher-пространством. В 1994 г. была создана универсальная поисковая машина Veronica, которая могла осуществлять поиск информации по всем серверам gopher-пространства. Достоинство: простота организации поисковых алгоритмов.Недостаток: ограниченная область применения (библиотечные ресурсы, базы данных издательских систем).
р1 pn pn-1 р2 Гипертекстовая модель описывает взаимосвязи информационных ресурсов Сети в виде направленного графапроизвольной структуры. Данная модель реализована в пространстве информационных ресурсов World Wide Web (WWW) и является на сегодняшний день преобладающей, т.к. позволяет структурировать практически любую информацию Internet. Недостаток – сложность управления такой структурой.
В 1989 году в Европейской лаборатории физики элементарных частиц (CERN, Швейцария, Женева) Тим Бернерс-Ли разработал компьютерную технологию гипертекстовых документов - World Wide Web, позволяющую пользователям иметь доступ к любой информации, находящейся в сети Internet на компьютерах по всему миру. 1-я web страница: 12 декабря 1991 г.
Первый web сервер запущен в эксплуатацию в 1991 г. в Стенфордском ускорителе элементарных частиц (SLAC) на мэйнфрейме NeXT. В феврале 1993 г. программист Национального центра суперкомпьютерных вычислений (NCSA)Марк Андриссен разработал полнофункциональную версию браузера для Unix-систем под названием Mosaic. Декабрь 1994 г. – образован консорциум W3C,как центр координирующий разработки в области World Wide Web Сейчас объединяет более 350 организаций и компаний по всему миру.
Консорциум W3C – это некоммерческая, неправительственная, организация в задачи которой входит координация и стандартизация работ в области гипертекстовых технологий Интернет. www. w3c.org Директор и учредитель – Тим Бернерс-Ли (Tim Berners-Lee)
Web-сайт - это совокупность web-документов, объединенных общей тематикой и ссылками, обеспечивающими возможность перехода с одной страницы на другую. Web-узел(сервер) –это комплекс аппаратно-программных средств, обеспечивающих функционирование Web-сайта. Имеет по крайней мере один IP-адрес и, как правило, входит в состав локальной вычислительной сети.
Некоммерческие Коммерческие Персональные страницы Реального бизнеса Сетевого бизнеса Сайты некоммерческих организаций Реклама компании Торговля аудиторией Информационная поддержка продукта Информационная площадка Реализация товара Online-сервисы Классификация сайтов(по области применения) Web-сайты
Сайты реального бизнеса являются продолжением реального бизнеса на Интернет и служат, как вспомогательное средство для осуществления бизнес-операций. Сайты для бизнеса в Интернет не имеют за собой вещественных реальных торговых площадок и производственных мощностей.
Веб-клиент – это программа или модуль, способный принимать данные по гипертекстовому протоколу и интерпретировать их в виде веб-страницы. На персональных компьютерах в качестве веб-клиента, как правило, функционирует тот или иной браузер.