E N D
текстовой Кодирование информации
Одну и ту же информацию можно представить и передать по-разному.Например, сообщить об опасности:- Крикнуть «Караул!» или “Help me!”;- Передать сигнал SOS с помощью азбуки Морзе: “ ”; - Опасность поражения электрическим током выразить рисунком;- Для глухонемых людей — показать жестом. • Во всех этих случаях для представления информации используется определенный язык.
Язык • Язык может быть естественным (разговорным) или формальным (кодом или языком программирования) Язык (код)— определенная система знаков для представления информации.
Алфавит • Каждый язык (код) может быть представлен своим алфавитом. • Алфавит— набориспользуемых в языке символов.
Алфавит • Существует множество алфавитов, используемых для представления информации: • Алфавит кириллических букв; • Алфавит латинских букв; • Алфавит азбуки Морзе; • Алфавит дорожных знаков.
Кодирование • Часто мы передаем или храним информацию не в той форме, в которой она существует, а преобразовываем ее — кодируем. Если вдуматься, то кодирование информации вокруг нас происходит постоянно: -Уровень знаний по предмету кодируется соответствующим числом: 5,4,3,2,1; -Предупреждающие сигналы на дороге закодированы с помощью дорожных знаков;
Кодирование -Информация о протеканиихимической реакции кодируется с помощью записи уравнения химической реакции; - При передаче информации по телефону сигналы кодируются для передачи и декодируются, чтобы их можно было воспринимать.
Кодирование декодирование • Музыкальная композицияможет быть сыграна на инструменте (закодирована и передана с помощью звуков), записана с помощью нот (кодами являются ноты) или записана на магнитный диск (коды — электромагнитные сигналы). Кодирование— преобразование информации в форму, удобную для передачи, хранения или обработки. Декодирование — преобразование информации в форму, удобную для восприятия.
Информация в ПК • Компьютер с точки зрения пользователяработает с информацией разных видов и представлений: числовой, графический, звуковой, текстовой, видео. Но по сути вся информация представлена в виде сигналов всего двух видов: намагничено/размагничено — для магнитного диска, отражает/не отражает — для лазерного диска, есть электрический сигнал/нет сигнала — для полупроводниковых приборов. Технические устройства для обработки двоичных сигналов устойчиво работают и получаются значительно более простыми.
Информация в ПК • Таким образом, вся информация — звуки, изображения, показания приборов, для обработки на компьютере должна быть преобразована в числовую форму, т. е. закодирована. Для кодирования информации используется двоичный код, алфавит которого состоит из двух цифр: нуля и единицы.
Кодирование текстовой информации • В настоящее время большая часть персональных компьютеров в мире занята обработкой текстовой информации. • Для кодирования одного символа используется 1 байт.
Кодирование текстовой информации • С помощью одного байта можно закодировать 256 различныхсимволов — все символы клавиатуры. • Кодирование заключается в том, что все символы в таблице пронумерованы и каждому символу ставится в соответствие уникальный двоичный код от 00000000 до 11111111.
Кодовые таблицы • Присвоение символу конкретногокода — это вопрос соглашения, которое фиксируется в кодовой таблице. • Кодовая таблица, содержащая 256 символов, состоит из двух частей, двух таблиц кодирования — базовой и расширенной. • В базовой таблице определены значения кодов с 0 по 127, а в расширенной — со 128 по 255.
США, институт стандартизации (АSCII) Таблица АSCII разделена на 2 части • -стандартная(содержит коды от 0 до 127) • - расширенная (содержит символы с кодами от 128 до 255)
Кодовые таблицы • Первая половина кодовой таблицы — базовая таблица — принята в качестве международного стандарта и называется кодировкой ASCII (AmericanStandard Code for Information Interchange — Американский стандартный код для обмена информацией). • Кодовая таблица ASCII содержит 128 символов — коды с 0 по 127.
Кодовая таблица ASCII • В базовой таблице за кодами с 0 по 32 закреплены специальные функции: нажатие клавиши Enter, Bs, управление курсором, ввод пробела и т.д. • Коды с 33 по 127 соответствуют символам: !, #, $, цифрам, знакам арифметических операций, знакам препинания и символам латинского алфавита.
Расширение таблицы ASCII • Вторая половина кодовой таблицы не определена американским стандартом, предназначена для кодирования национальных алфавитов и назавается расширением таблицы ASCII.
Кодовые таблицы • В настоящее время существует пять различных 8-битных кодовых таблиц для русских букв: • КОИ-8; • СР-1251; • СР-866; • Мас; • ISO.
Кодовые таблицы • КОИ-8; • СР-1251; • СР-866; • Мас; • ISO. • В каждой кодовой таблице первая половина таблицы (коды с 0 по 127) представляет собой кодировку ASCII.
КОИ-8 • Хронологически одним из первых стандартов кодирования русских букв на компьютерах был код КОИ-8 — Код обмена информацией, 8-битный. Эта кодировка стала фактическим стандартом в Интернете, используется в операционной системе UNIX, чаще всего применяется для обмена почтой и новостями.
Кодировка СР-866 • Для операционной системы MS-DOS была создана альтернативная кодировка CP-866. (CP — code page).
Кодировка СР-1251 • После появления ОС Windows фирмой Microsoft была создана кодировка Windows — CP-1251.
Другие кодировки • Компьютеры фирмы Apple, работающие под управлением операционной системы Mac OS, используют свою собственную кодировкуMac. • Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названиемISO 8859-5, которая большого распространения не получила.
Unicode • В конце 90-ых годов появился новый международный стандарт Unicode, который отводит под кодирование одного символа не один байт, а два, и поэтому с его помощью можно закодировать не 256, а 65536 различных символов — все существующие созданные алфавиты мира, а также множество специализированных символов: математических, музыкальных, химических и прочих символов.
Unicode • Кодировка Unicode с 1997 года используется в пакете Microsoft Office. Главный недостаток этой кодировки — информационный вес текста увеличивается в два раза.
Программы-конверторы • В связи с тем, что коды одних и тех же символов в различных кодовых таблицах не совпадают, тексты, созданные в одной кодировке, не будут правильно отображаться в другой. • Для того чтобы стало возможным чтение и редактирование текста, набранного в другой кодировке, для перекодирования текста используются специальные программы-конверторы.
Alt-ввод • Если вам известен код символа, то символ можно получить, набрав его код на малой цифровой клавиатуре при включенном индикаторе Num Lock и прижатой клавише Alt. • Каждому символу соответствует свой код: • 128 — русская буква А; • 160 — русская буква а; • 33 — восклицательный знак; • 32 — пробел; • 045 — дефис; • 0151 — тире; • 0150 — минус.
Задание :определите символ по числовому коду. • Запустите программу БЛОКНОТ • Нажмите ALT и 0224 (на дополнительной цифровой клавиатуре). • Появится символ а. • Повторитеэту операцию для числовых кодов от 0225 до 0233. • Появятся символы в кодировке (CP 1251 Windows). • Запишите их в тетрадь.
Задание 2:определите символ по числовому коду. • Запустите программу БЛОКНОТ • Нажмите ALT и 161 (на дополнительной цифровой клавиатуре). • Появится символ. • Повторитеэту операцию для числовых кодов 160, 169, 226. • Появятся символы в кодировке (CP 866 MS-DOS). • Запишите их в тетрадь.