КОДИРОВАНИЕ ИНФОРМАЦИИ
ПЛАН УРОКА:
- Кодирование – обработка информации
- Три способа кодирования текста
- Кодирование символьной информации в ЭВМ
- Кодирование числовой информации в ЭВМ
- Представление графической информации в ЭВМ
- Представление звука в ЭВМ
Кодирование информации
Кодирование информации – это преобразование информации в символьную форму, удобную для хранения, передачи и обработки. Обратное преобразование называется Декодированием.
Способ кодирования зависит от цели, ради которой оно осуществляется:
- сокращение записи;
- засекречивание (шифровка) информации;
- удобства обработки ( например, в компьютере вся информация кодируется двоичными кодами );
- удобства передачи информации ( например, Азбука Морзе )
Азбука МОРЗЕ
А • -
Л • - • •
Б - • • •
Ц - • - •
М - -
В • - -
Ч - - - •
Г - - •
Н - •
Ш - - - -
О - - -
Д - • •
Щ - - • -
П • - - •
Е •
Ж • • • -
Р • - •
Ъ • - - • - •
Ы - • - -
С • • •
З - - • •
Ь - • • -
Т -
И • •
Э • • - • •
У • • -
Й • - - -
Ю • • - -
Ф • • - •
К - • -
Я • - • -
Х • • • •
Способы кодирования текста
- Графический – с помощью специальных рисунков и символов;
- Числовой – с помощью чисел;
- Символьный – с помощью символов того же алфавита, что и исходный текст.
Числовой способ кодирования
Пример 2. Зашифрованная пословица.
Чтобы рубить дрова нужен
а чтобы полить огород –
Рыбаки сделали во льду
и стали ловить рыбу.
Самый колючий зверь в лесу – это
А теперь прочитайте пословицу:
14, 2, 3, 2, 7
10, 4, 5, 1, 6
3, 7, 2, 7, 8, 9, 11
12, 13
1, 2, 3, 4, 5, 1, 6
7, 8, 9, 10, 11
9, 4, 7, 4, 13, 12, 14
Ответ:
КОПЕЙКА РУБЛЬ БЕРЕЖЁТ
Пример 3. Можно каждую букву заменить её порядковым номером в алфавите: Зашифруйте фразу: Я УМЕЮ КОДИРОВАТЬ ИНФОРМАЦИЮ.
1
А
2
Б
12
К
13
Л
3
В
23
Х
4
Г
24
Ц
14
М
5
Д
15
Н
25
Ч
26
Ш
6
Е
16
О
27
Щ
17
П
7
Ё
8
Ж
28
Ъ
18
Р
19
С
9
З
29
Ы
10
И
30
Ь
20
Т
21
У
11
Й
31
Э
32
Ю
22
Ф
33
Я
Ответ:
33211463212165101816312030
1015221618141241032
Пример 4. Дана кодировочная таблица(первая цифра кода – номер строки, вторая – номер столбца): С помощью этой кодировочной таблицы: а) зашифруйте фразу: Я_УМЕЮ_РАБОТАТЬ_С_ИНФОРМАЦИЕЙ!_А_ТЫ? б) расшифруйте текст: 25201538350304053835111503040038
0
0
1
1
А
Б
2
2
И
Т
3
3
В
К
У
Ы
Л
4
4
Г
5
Д
М
:
Ь
Ф
Н
;
Е
Э
6
Х
-
Ю
Ц
О
7
Ё
Ч
Ж
8
П
Я
!
Ш
«
Р
_
З
Й
С
.
Щ
,
Ъ
?
Ответ:
а) 34352113053335
1700011520002031351835
10142215171300241005454335
0035203038
Ответ:
б) ЧТО?_ГДЕ?_КОГДА?
Символьный способ кодирования А Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я Пример 5. Шифр «Цезаря» Этот шифр реализует следующие преобразование текста: каждая буква исходного текста заменяется третьей после неё буквой в алфавите, который считается написанным по кругу. Используя этот шифр: - зашифруйте слова: ИНФОРМАЦИЯ, КОМПЬЮТЕР, ЧЕЛОВЕК. - расшифруйте слово НУЛТХСЁУГЧЛВ.
Пример 6.
Шифр «Перестановки».
Кодирование осуществляется перестановкой букв в слове по одному и тому же общему правилу.
Восстановите слова и определите правило перестановки:
ЛБКО
ЕРАВШН
УМЫЗАК
АШНРРИ
РКДЕТИ
Ответ:
ИНФОРМАЦИЯ – ЛРЧСУПГЩЛВ
КОМПЬЮТЕР – НСПТЯБХЗУ
ЧЕЛОВЕК - ЪЗОСЕЗН
Ответ:
НУЛТХСЁУГЧЛВ - КРИПТОГРАФИЯ
ПРЕДСТАВЛЕНИЕ СИМВОЛЬНОЙ ИНФОРМАЦИИ В ЭВМ
«Текстовая информация»=«Символьная информация»
Текст – любая последовательность символов.
Символьный алфавит компьютера – множество символов, используемых на ЭВМ для внешнего представления текстов
(буквы латинского и русского алфавитов, десятичные цифры, знаки препинания, специальные символы % , &, $, # , @ и др.)
Символьная информация внутри компьютера кодируется двоичными числами (двоичный алфавит - 0 и 1)
Последовательностью из одного знака можно закодировать всего две буквы :
0 – А
1 - Б
Последовательностью из двух знаков можно закодировать четыре буквы:
00 – А
01 – Б
10 – В
11 – Г
Трехзнаковой последовательностью можно закодировать уже восемь букв:
000 – А
001 – Б
010 – В
011 – Г
100 – Д
101 – Е
110 – Ж
111 – З
ДЕДВЕЗЕЖА – 100 101 100 010 101 111 101 110 000
ГДЕВАЗА
0000000
………………………… ..
………………………… ..
………………………… ..
1111111
Семизначной последовательностью можно закодировать 2 7 = 128 символов .
Этого хватает, чтобы закодировать сообщение на хорошем русском языке.
Именно таков отечественный код КОИ-7
(Код Обмена Информацией)
Появление одного знака 0 или 1 в последовательности будем называть словом БИТ (от английского BI nary digi T – двоичная цифра)
Используя восьмибитный код можно закодировать 2 8 = 256 символов. Символьный алфавит компьютера состоит именно из 256 символов.
Восьмибитный код называется ASCII ( A merican S tandard C ode for I nformation I ntercherge – Американский Стандартный Код Обмена Информацией )
Благодаря восьмибитному кодированию можно использовать в тексте и прописные и строчные буквы как русского так и латинского алфавитов, знаки препинания, цифры и специальные символы &, $, #, @, % и др.
Существует 256 всевозможных 8-разрядных комбинаций, составленных из 0 и 1 :
от 00000000 до 11111111 , которые представлены в таблице кодировок.
Таблица кодировок – это стандарт, ставящий в соответствие каждому символу алфавита свой порядковый номер от 0 до 255, двоичный код символа – это его порядковый номер в двоичной системе счисления.
Т.е. таблица кодировок устанавливает связь между
внешним символьным алфавитом компьютера
и внутренним двоичным представлением .
Таблица стандартной части кода ASCII
32
33
34
!
00100000
35
“
56
00100001
36
#
00100010
8
57
$
9
00111000
00100011
37
58
%
59
00100100
- :
80
38
00111001
&
00111010
60
81
39
;
P
00100101
40
00111011
‘
82
00100110
01010000
61
Q
00111100
83
(
41
00100111
62
104
=
01010001
R
84
)
63
S
42
h
00111101
00101000
105
01010010
01101000
106
00101001
?
00111110
01010011
*
i
T
64
85
43
+
00111111
@
65
44
j
86
01010100
01101001
107
U
00101010
01101010
A
108
,
01000000
k
45
87
00101011
01010101
66
V
88
01000001
01101011
46
l
-
67
109
W
01010110
B
00101100
01101100
89
.
C
00101101
01000010
68
47
X
01010111
m
110
01000011
00101110
69
111
D
01011000
48
n
01101101
90
Y
/
01101110
E
o
01000100
01011001
112
49
70
91
0
00101111
Z
1
113
01000101
p
F
92
01101111
50
01011010
71
[
00110000
01000110
q
93
2
51
01110000
G
\
72
00110001
01011011
114
94
3
01110001
H
73
00110010
52
01000111
115
01011100
r
]
I
01011101
00110011
01110010
74
s
53
4
01001000
116
^
95
J
01001001
t
54
5
117
01011110
75
96
01110011
00110100
_
118
6
01001010
K
u
97
01110100
55
`
00110101
76
01011111
v
98
01001011
7
01110101
a
00110110
77
01100000
119
L
01110110
99
01001100
M
b
78
01100001
00110111
120
w
01001101
79
N
c
01110111
100
x
121
01100010
O
01111000
01100011
101
01001110
y
122
d
z
01001111
102
01111001
123
e
01100100
{
01111010
103
01100101
f
124
01111011
01100110
g
125
|
01100111
}
01111100
126
127
01111101
~
01111110
.
01111111
Таблица альтернативной части кода ASCII
128
А
130
В
10000000
132
Д
10000010
134
129
131
136
Б
10000100
Ж
И
10000110
138
133
Г
10000001
135
Е
10001000
К
140
10000011
З
137
1142
М
10001010
10000101
10001100
О
139
144
Й
10000111
10001110
Р
141
Л
146
10001001
Н
143
10010000
148
10001011
Т
145
П
Ф
10010010
150
10001101
С
152
Ц
10010100
10001111
147
У
10010110
149
154
10010001
Ш
Ъ
10011000
Х
156
151
10010011
153
10011010
158
Ь
Ч
10010101
155
Ю
Щ
10011100
10010111
10011110
157
Ы
10011001
Э
159
10011011
Я
10011101
10011111
UNICODE – новый международный стандарт символьного кодирования.
Это 16-битное кодирование, т.е. на каждый символ отводится 16 бит (2 байта) памяти.
Сколько символов можно закодировать, используя UNICODE ?
ПРЕДСТАВЛЕНИЕ ЧИСЛОВОЙ ИНФОРМАЦИИ
Числа в памяти ЭВМ хранятся в двух форматах:
- формат с фиксированной точкой (целые числа);
- формат с плавающей точкой (десятичные дроби).
Под точкой понимается знак разделения целой и дробной части числа.
Чтобы получить внутреннее представление целого положительного числа N в формате с фиксированной точкой нужно:
- Перевести число N в двоичную систему счисления;
- Полученный результат дополнить слева незначащими нулями до 16 разрядов.
Пример 7. Получить внутреннее представление числа N =1607
Для записи внутреннего представления целого отрицательного числа (- N) нужно:
- Получить внутреннее представление положительного числа N;
- Получить обратный код этого числа заменой 0 на 1 и 1 на 0 ;
- К полученному числу прибавить 1.
Пример 8. Определим по этим правилам внутреннее представление числа –1607.
Решение:
1607 10 = 11001000111 2
Внутреннее представление этого числа в машинном слове будет следующим:
0000 0110 0100 0111
в сжатой шестнадцатеричной форме этот код запишется так: 0647
Решение:
1607 10 = 11001000111 2
0000 0110 0100 0111
1111 1001 1011 1000
+1
____________________________________________________
1111 1001 1011 1001
ПРЕДСТАВЛЕНИЕ ГРАФИЧЕСКОЙ ИНФОРМАЦИИ
Существует два подхода к решению проблемы представления изображения на компьютере:
- РАСТРОВЫЙ подход предполагает разбиение изображения на маленькие одноцветные элементы – видеопиксели, которые, сливаясь, дают общую картинку.
- ВЕКТОРНЫЙ подход разбивает всякое изображение на геометрические элементы: отрезки прямой, эллиптические дуги, фрагменты прямоугольников, окружностей и пр. При таком подходе видеоинформация – это математическое описание перечисленных элементов в системе координат, связанной с экраном монитора.
Растровый подход универсальный, т.е. он применим всегда, независимо от характера изображения. На современных ПК используется только растровые дисплеи, работающие по принципу построчной развертки изображения.
Все разнообразие цветов, которое мы видим на экране компьютера достигается смешиванием всего лишь трёх основных цветов: красного, зеленого и синего, так называемая RGB -цветовая модель ( Red, Green, Blue ). Любой другой цвет характеризуется тем, какая в нем доля красного, зеленого и синего цветов
Восьмицветная палитра Пример 9. Смешиванием каких цветов получается розовый цвет? Пример 10. Известно, что коричневый цвет получается смешиванием красного и зеленого цветов. Какой код у коричневого цвета?
К
З
0
С
0
0
Цвет
0
0
0
0
Черный
1
1
1
1
0
Синий
Зеленый
1
0
1
1
Голубой
0
0
1
1
1
Красный
Розовый
0
1
Коричневый
1
Белый
Шестнадцатицветная палитра кодируется 4 битами по принципу «ИКЗС» , где И – бит интенсивности, дополнительный бит, управляющий яркостью цвета.
Это те же 8 цветов, но имеющие два уровня яркости.
Например, если в 8-цветной палитре код 100 обозначает красный цвет , то в 16-цветной палитре:
0100 – красный, 1100 – ярко красный цвет;
0110 – коричневый, 1110 – ярко-коричневый
(желтый)
Палитры большего размера получаются путем раздельного управления интенсивностью каждого из трёх базовых цветов. Для этого в коде цвета под каждый базовый цвет цвет выделяется более одного бита.
Например, структура восьмибтного кода для палитры из 256 цветов такая: «КККЗЗЗСС»
Связь между разрядностью кода цвета – b
и количеством цветов – К (размером палитры)
выражается формулой К=2 b .
Разрядность кода цвета – b принято называть
битовой глубиной цвета.
Так называемая естественная палитра цветов получается при b =24 , для такой битовой глубины палитра включает более 16 миллионов цветов (2 24 = 16 777 216)
ПРЕДСТАВЛЕНИЕ ЗВУКА
Основной принцип кодирования звука, как и кодирование изображения, выражается словом «дискретизация»
Физическая природа звука – это колебания в определенном диапазоне частот, передаваемые звуковой волной через воздух (или другую упругую среду)
Процесс преобразования звуковых волн в двоичный код в памяти компьютера
Звуковая волна
МИКРОФОН
Переменный электрический ток
АУДИОАДАПТЕР
ПАМЯТЬ ЭВМ
Двоичный код
Процесс воспроизведения звуковой информации, сохраненной в памяти компьютера
ПАМЯТЬ ЭВМ
Двоичный код
АУДИОАДАПТЕР
Электрический сигнал
АКУСТИЧЕСКАЯ
СИСТЕМА
Звуковая волна
АУДИОАДАПТЕР (Звуковая плата) – специальное устройство, подключаемое к компьютеру, предназначенное для преобразования электрических колебаний звуковой частоты в числовой двоичный код при выводе звука и для обратного преобразования (из числового кода в электрические колебания) при воспроизведении звука.
В процессе записи звука аудиоадаптер с определенным периодом измеряет амплитуду электрического тока и заносит в регистр двоичный код полученной величины. Затем двоичный код из регистра переписывается в оперативную память компьютера.
Качество компьютерного звука определяется характеристиками аудиоадаптера:
частотой дискретизации и разрядностью.
Частота дискретизации – это количество измерений входного сигнала за 1 секунду. Частота измеряется в Герцах (Гц).
Одно измерение за 1 секунду соответствует частоте 1Гц. 1000 измерений за 1 секунду – 1 килогерц (1кГц). Характерные дискретизации аудиоадаптеров: 11кГц, 22 кГц, 44,1 кГц и др.
Разрядность регистра – число бит в регистре аудиоадаптера. Разрядность определяет точность измерения входного сигнала. Чем больше разрядность, тем меньше погрешность каждого отдельного преобразования величины электрического сигнала в двоичное число и обратно.