Измерение информации
Алфавитный подход к измерению информации
При алфавитном подходе к определению количества информации отвлекаются от содержания информации и рассматривают информационное сообщение как последовательность знаков определенной знаковой системы.
Все множество используемых в языке символов будем традиционно называть алфавитом .
Полное количество символов алфавита принято называть мощностью алфавита .
Будем обозначать эту величину буквой N .
МОЩНОСТЬ РУССКОГО АЛФАВИТА:
- 33 буквы
- 10 цифр
- 11 знаков препинания
- скобки
- пробел
Информационный вес символа
Информационный вес символа зависит от мощности алфавита.
информационный вес символа — количество информации, которое несет один символ.
Самое наименьшее число символов в алфавите: 2 (0 и 1) - двоичный алфавит.
Информационный вес символа двоичного алфавита принят за единицу информации и называется 1 БИТ.
С увеличением мощности алфавита увеличивается информационный вес символов этого алфавита. Так один символ из четырехсимвольного алфавита ( N =4) «весит» 2 бита.
Используя три двоичные цифры, можно составить 8 различных комбинаций
Следовательно, если мощность алфавита равна 8, то информационный вес одного символа равен 3 битам.
Порядковый номер символа
1
Двузначный двоичный код
2
00
3
01
10
4
11
Порядковый номер символа
Трехзначный двоичный код
1
2
000
3
001
010
4
011
5
6
100
7
101
8
110
111
Четырехзначным двоичным кодом может быть закодирован каждый символ из 16-ти символьного алфавита. И так далее.
Найдем зависимость между мощностью алфавита ( N) , и количеством знаков в коде ( b) – разрядностью двоичного кода.
Заметим, что 2=2 1 , 4=2 2 , 8=2 3 , 16=2 4 .
В общем виде это записывается следующим образом: N=2 b
N
b
2
4
1 бит
8
2 бита
16
3 бита
4 бита
Таблица зависимости мощности алфавита от информационного веса символа
b (бит),
Информа-ционный вес символа
Символы алфавита
1
N ,
Мощность алфавита
0 1
2
00 01 10 11
2 = 2 1
3
000 001 010 100
4 = 2 2
011 101 110 111
…
8 = 2 3
…
8
00000000… …11111111
256 = 2 8
Разрядность двоичного кода – это и есть информационный вес символа.
Информационный вес каждого символа, выраженный в битах ( b ) , и мощность алфавита ( N ) связаны между собой формулой: N=2 b
Алфавит, из которого составляется «компьютерный текст», содержит 256 символов. В алфавит такого размера можно поместить практически все необходимые символы.
Поскольку 256=2 8 , то один символ компьютерного алфавита «весит» 8 битов информации – это настолько характерная величина, что ей даже присвоили свое название – байт.
1 байт = 8 бит
Легко подсчитать информационный объем текста, если известно, что информационный вес одного символа равен 1 байту. Надо просто сосчитать число символов в тексте. Полученное значение и будет информационным объемом текста, выраженным в байтах.
ЕДИНИЦЫ ИЗМЕРЕНИЯ ИНФОРМАЦИИ
СИМВОЛЬНЫЙ АЛФАВИТ КОМПЬЮТЕРА
- русские (РУССКИЕ) буквы
- латинские ( LAT ) буквы
- цифры (1, 2, 3, 4, 5, 6, 7, 8, 9, 0)
- математические знаки (+, -, *, / , ^, =)
- прочие символы («», №, %, , , :, ;, #, &)
b = 8 бит = 1 байт
N = 256 = 2 8
N = 2 b
1 байт - это информационный вес одного символа компьютерного алфавита
=
=
=
1024 байта
2 10 байт
1 Кб
1 килобайт
1 Мб
1 мегабайт
2 10 Кб
1024 Кб
=
=
=
1024 Мб
2 10 Мб
1 гигабайт
1 Гб
=
=
=
10
1 Мбайт (мегабайт) = 1024 Кбайта (2 10 Кбайт или 2 20 байт)
1 Гбайт (гигабайт) = 1024 Мбайта (2 10 Мбайт или 2 30 байт)
1 Тбайт (терабайт) = 1024 Гбайта (2 10 Гбайт или 2 40 байт)
Но в недалеком будущем нас поджидают следующие единицы:
1Пбайт (петабайт) = 1024 Тбайта (2 10 Тбайт или 2 50 байт)
1Эбайт (экзабайт) = 1024 Пбайта (2 10 Пбайт или 2 60 байт)
1 Збайт (зеттабайт) - 1024 Эбайта (2 10 Эбайт или 2 70 байт)
1 (йоттабайт) - 1024 Збайта (2 10 Збайт или 2 80 байт)
10
ИНФОРМАЦИОННЫЙ ОБЪЕМ ТЕКСТА
ЗАДАЧА
Книга, подготовленная с помощью компьютера, содержит 150 страниц . На каждой странице – 40 строк , в каждой строке – 60 символов (включая пробелы между словами). Каков объем информации в книге?
РЕШЕНИЕ
Мощность компьютерного алфавита равна 256, поэтому один символ несет 1 байт информации. Значит, страница книги содержит 40 60 = 2400 байт информации.
[ кол-во символов в строке ] [ кол-во строк ] = [ информационный объем страницы ]
Объем всей информации в книге (в разных единицах):
[ информационный объем страницы ] [ кол-во страниц ] = [ информационный объем книги ]
2400 150 = 360 000 байт / 1024 = 351,5625 Кбайт / 1024 = 0,34332275 Мбайт
10
Задача 1
Сообщение записанное буквами из 128 –символьного алфавита, содержит 30 символов. Какой объем информации оно несет?
N = 2 b
N = 128= 2 7 ,
b = 7 бит (вес одного символа).
Сообщение содержит 30 символов, следовательно
7×30= 210 бит
10
Задача 2
Сколько байтов составляет сообщение, содержащее 1000 бит?
ОТВЕТ:
1 байт = 8 бит
1000: 8 = 125 байт
10
Задача 3
Информационное сообщение объёмом 5 Кбайт содержит 8192 символа. Сколько символов содержит алфавит, при помощи которого было записано это сообщение?
РЕШЕНИЕ
N = 2 b
5 Кб = 5120 байт = 40960 бит
Сообщение содержит 8192 символа, следовательно
b = 40960 : 8192 = 5 бит (вес одного символа).
N=2 5 = 32
10
Задача 4
Текст, набранный на компьютере , занимает пять страниц. На каждой странице размещается 30 строк по 70 символов в строке. Какой объем оперативной памяти занимает этот текст ? Поместится ли текст на CD?
Ответ
30 × 70 = 2100 символов
2100 × 8 = 16800 байт
16800 : 1024 = 16,40625 Кбайт
10
Задача 5
Какое количество информации в сообщении из 10 символов, записанном буквами из 32-символьного алфавита?
N = 2 b
РЕШЕНИЕ
N = 32,
b - ?
32= 2 b ,
b = 5 бит
Объем информации
I = 10*5 = 50 бит
10
Задача 6
Для хранения текста требуется 84000 бит. Сколько страниц займёт этот текст, если на странице размещается 30 строк по 70 символов в строке?
РЕШЕНИЕ
1 байт=8 бит.
84000/8=10500 символов в тексте.
На странице помещается
30×70=2100 символов.
10500/2100 =
5 страниц.
5 страниц.
ОТВЕТ:
10
Задача 7
У племени "чичевоков" в алфавите 24 буквы и 8 цифр. Знаков препинания и арифметических знаков нет. Какое минимальное количество двоичных разрядов им необходимо для кодирования всех символов?
N = 2 b
РЕШЕНИЕ
N=24+8=32
N = 32,
b - ?
32= 2 b ,
b = 5 бит
ОТВЕТ:
5 бит
10
Первое письмо состоит из 50 символов 32-символьного алфавита, а второе – из 40 символов 64 – символьного алфавита.
Сравните объемы информации, содержащиеся
в двух письмах.
Задача 8
Определим информационную емкость одного символа в каждом из писем:
РЕШЕНИЕ
2 b = 32, b = 5 бит – для первого письма, 2 b = 64, b = 6 бит – для второго письма
Определим количество информации в каждом из писем:
50*5 = 250 бит – для первого письма,
40*6 = 240 бит – для второго письма.
Найдем разность между информационными объемами двух писем. 250 - 240 = 10 бит.
10