Кодирование чисел, символов и графической информации, единицы измерения данных

МИНОБРНАУКИ  РОССИИ

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ  БЮДЖЕТНОЕ

ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ

ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО  ОБРАЗОВАНИЯ

Санкт-Петербургский  государственный  университет

сервиса и экономики 
 

     Кафедра: “Информатики”

  

                          Контрольная  работа по информатике

Тема: Кодирование  чисел, символов и графической информации, единицы  измерения данных.

                                    
 

                                                                                    Выполнила студентка 1 курса

                                                                                    заочного отделения

                                                                                    специальность:  080100.62

                                                                                    Сергеева Екатерина Андреевна 

                                                                              Проверил: Судаков С.Е. 
       
       

                                               Санкт-Петербург

                                                         2012

  1. Кодирование чисел, символов и графической информации, единицы измерения

     1.1Кодирование чисел. Системы счисления

     1.2. Перевод целых чисел из системы счисления с основанием  k в          десятичную систему счисления

     1.3. Двоичная система счисления

    1.4. Перевод целых чисел из десятичной системы счисления в систему счисления с другим основанием

     1.5. Шестнадцатеричная система счисления

     1.6. Вавилонская (шестидесятеричная) система счисления

     1.7. Кодирование двоичным кодом

     1.8. Кодирование символов. Байт.

     1.9. Единицы измерения объема данных и ёмкости памяти: килобайты, мегабайты, гигабайты…

     1.10. Кодирование графической информации

    

  1. Практическое задание №2
 
  1. Практическое задание №3
 
  1. Список  литературы
 
 
 

 

  1. Кодирование чисел, символов и  графической информации, единицы измерения 
 

 Код - это  набор условных сигналов для  записи или передачи некоторых  заранее определенных понятий. 

 Рис. 1. Примеры систем кодирования.

 Любой способ  кодирования характеризуется наличием  основы (алфавит, спектр цветности,  система координат, основание  системы счисления…) и правил  конструирования информационных  образов на этой основе.

1.1. Кодирование чисел. Системы счисления 

Система счисления (СС) - способ кодирования числовой информации, т.е. способ записи чисел с помощью  некоторого алфавита, символы которого называют цифрами. 

 Различают  системы счисления позиционные  и непозиционные. Пример позиционной  системы счисления — арабская (современная десятичная), непозиционной — римская.

Позиционная СС                                  Непозиционная СС
005 = 5*1 (пять)                                                                XI = 10+1 = 11
050 = 5*10 (пятьдесят) IX = 10-1 = 9                        
500 = 5*100 (пятьсот)  XX = 10+10 = 20

 Таблица 1. 

  В позиционных  системах счисления величина, обозначаемая  цифрой в записи числа, зависит  от её положения в числе  (позиции, разряда). Количество используемых  цифр называется основанием системы  счисления.

 Так, в  десятичной системе счисления,  основание которой равно 10, различают  10 арабских цифр - 0, 1, 2, ..., 9.

 В вычислительной  технике широко применяют двоичную, восьмеричную и шестнадцатеричную систему счисления.

 Двоичная система счисления имеет основание 2, и, следовательно, ее алфавит состоит из двух цифр - 0 и 1; алфавит восьмеричной системы счисления составляют цифры 0, 1, 2, 3, 4, 5, 6, 7; шестнадцатеричной - десять арабских цифр от 0 до 9 и еще шесть символов - А (10), В (11), С (12), D (13), E (14), F (15).

 Для любой  позиционной системы счисления  справедливо следующее правило  формирования числа на основании входящих в эту систему цифр:

,(1)

Где ( y – число; k – основание системы счисления; xi – цифры числа;

i – номер  позиции (разряда) числа, начиная с 0).

Так, на основании  формулы  десятичное число 638(10) представляется следующим образом:

 Мы говорим  в таком случае, что в этом  числе 6 сотен, 3 десятка и 8 единиц.

 Исторически,  использование для счета десяти  цифр связано с тем, что человечество  училось считать на пальцах.  На самом деле для представления  любого числа достаточно алфавита, состоящего только из двух  символов, что и реализуется, при  хранении информации в памяти  электронных устройств. Ячейка  памяти в этом случае может  находиться в одном из двух  состояний, которые кодируются  как 0 и 1. Информационная емкость  такой ячейки равна 1 биту.  
 

1.2. Перевод целых чисел из системы счисления с основанием k в десятичную систему счисления 

 Число, записанное  в позиционной системе счисления  с любым основанием, переводится  в десятичную систему счисления  по правилу(1).

 Если, например, 45(8) – число, записанное в восьмеричной системе счисления, то

45(8)=4*81+5*80=4*8+5*1=32+5=37(10)

 Число 203(5) записано в пятеричной системе  счисления, тогда

203(5)=2*52+0*51+3*50=2*25+0*5+3*1=50+0+3=53(10)

Меняется только основание системы счисления, алгоритм остается неизменным.

 Основание  позиционной системы счисления  в ней самой всегда записывается  как 10; например, в двоичной системе  счисления 10(2) означает число  2(10), а в восьмеричной 10(8) означает число 8(10).

 Чтобы легче  осуществлять перевод из системы  счисления по любому основанию  в десятичную, следует для начала явно пронумеровать разряды исходного числа справа налево, начиная с 0 (см. рисунок 14). 

 1.3. Двоичная система счисления  

 Двоичная (бинарная) система счисления имеет основание  2. Ее алфавит – цифры 0 и  1. Для перевода числа из двоичной  системы счисления в десятичную также справедливо правило (1). Представим в десятичном виде число 1101(2), или, что то же самое, &1101 (& - амперсант, - этим символом принято указывать то, что следующая за ним запись двоичная).

1101(2)=1*23+1*22+0*21+1*20=1*8+1*4+0*2+1*1=13(10)

Рис. 2. Перевод числа из двоичной СС в десятичную.

 Но двоичная  система имеет некоторые приятные  особенности, т.к. коэффициентами  при степенях двойки в ней  могут быть только либо нули (и тогда можно просто игнорировать  разряд числа, имеющий значение  “0”), либо единицы (умножение на “1” также можно опустить).

 Т.е. достаточно  просуммировать “два в соответствующей  степени” только в тех позициях  двоичного числа, в которых  находятся единицы. Степень же, в которую нужно возводить число 2, равна номеру позиции.

 Арифметические  операции в любой позиционной  системе счисления также имеют общую логику.


Таблица 2.

Каждый разряд двоичного числа имеет информационную емкость 1 бит. На основании одного двоичного разряда можно закодировать только два десятичных числа - &0=0(10), &1=1(10), на основании двух двоичных разрядов можно закодировать уже четыре десятичных числа – &00=0(10), &01=1(10) , &10=2(10), &11=3(10) , тремя двоичными разрядами можно представить восемь десятичных чисел и т.д. в соответствии с формулой Хартли (2).

 

Таблица 3. 

Мы видим, что  добавление каждого следующего разряда  вдвое увеличивает количество двоичных комбинаций. Графически это может  быть представлено так:

Рис. 3. Каждый следующий разряд двоичного числа удваивает количество возможных комбинаций из нулей и единиц

Таблицу степеней числа 2 от 20 до 210 следует знать наизусть.

N 0 1 2 3 4 5 6 7 8 9 10  
2N 1 2 4 8 16 32 64 128 256 512 1024  

Таблица 4.

Открытие двоичного  способа представления чисел приписывают китайскому императору Фо Ги, жизнь которого относится к 4-му тысячелетию до новой эры. Известный немецкий математик Лейбниц (1646-1716) в 1697 г. разработал правила двоичной арифметики. Он подчеркивал, что "вычисление с помощью двоек, то есть 0 и 1, в вознаграждение его длиннот, является для науки основным и порождает новые открытия, которые оказываются полезными впоследствии, даже в практике чисел, а особенно в геометрии: причиной чего служит то обстоятельство, что при сведении чисел к простейшим началам, каковы 0 и 1, всюду выявляется чудесный порядок".

 Блестящие  предсказания Лейбница сбылись  только через 2,5 столетия, когда  именно двоичная система счисления  нашла применение в качестве  универсального способа кодирования  информации в компьютерах. 
 
 

1.4 Перевод целых чисел из десятичной системы счисления в систему счисления с другим основанием

 Для осуществления  такого перевода необходимо делить  число с остатком на основание системы счисления до тех пор, пока частное больше основания системы счисления.

 Пример перевода  десятичного числа 25(10) в двоичный  вид показан на рисунке 16.

Рис. 4. Перевод числа из десятичной СС в двоичную.

 Результат  перевода записывается в обратном  порядке, т.е. начиная с последнего результата деления.

25(10)=11001(2) 

  1.5 Шестнадцатеричная система счисления 

 Система счисления  с основанием 16 интересна тем,  что она включает в себя  больше разрядов, чем десятичная, и соответственно десяти арабских  цифр недостаточно для алфавита  этой системы счисления, поэтому  в качестве недостающих цифр  в ней используются буквы латинского алфавита.

 Для обозначения  того, что запись является шестнадцатеричным  числом, принято использовать также символ #.  
 
 

Основание СС (k) Цифры, составляющие алфавит СС Пример записи
2 0, 1                                                                                 &101011111
10 0, 1, 2, 3, 4, 5, 6, 7, 8, 9                                                               351
16 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, a, b, c, d, e, f                                  #15f

Таблица 5.

 Для шестнадцатеричной  системы счисления действуют  те же правила перевода, что  и для всякой позиционной системы счисления.

                                               

Рис. 5а. Перевод из СС                   Рис. 5b. Перевод из СС с основанием           с основанием 16 в СС с основанием 10.         10 в СС с основанием 16. 

1.7. Кодирование двоичным кодом

Информация любого типа: символьная, графическая, звуковая, командная для представления  на электронных носителях кодируется на основании алфавита, состоящего только из двух символов (0, 1). Информация представленная в аналоговом виде, для того, чтобы быть сохраненной в электронной памяти,  оцифровывается и приводится к двоичному коду.  

Каждая ячейка электронной памяти обладает информационной ёмкостью 1 бит. Физически, в зависимости  от способа регистрации информации, это может быть конденсатор, находящийся  в одном из двух состояний: разряжен (0), заряжен (1); элемент магнитного носителя: размагничен (0), намагничен (1); элемент  поверхности оптического диска: нет лунки (0), есть лунка (1). Одним  из первых носителей информации, представленной в двоичном коде, была бумажная перфокарта, пробитое отверстие на которой означало 1, а цельная поверхность 0.  

1.8. Кодирование символов. Байт. 

 На основании  одной ячейки информационной  ёмкостью 1 бит можно закодировать  только 2 различных состояния. Для  того чтобы каждый символ, который  можно ввести с клавиатуры  в латинском регистре, получил  свой уникальный двоичный код,  требуется 7 бит. На основании  последовательности из 7 бит, в  соответствии с формулой Хартли, может быть получено N=27=128 различных  комбинаций из нулей и единиц, т.е. двоичных кодов. Поставив  в соответствие каждому символу  его двоичный код, мы получим  кодировочную таблицу. Человек  оперирует символами, компьютер – их двоичными кодами.

 Для латинской  раскладки клавиатуры такая кодировочная  таблица одна на весь мир,  поэтому текст, набранный с  использованием латинской раскладки,  будет адекватно отображен на  любом компьютере. Эта таблица  носит название ASCII (American Standard Code of Information Interchange) по-английски произносится [э́ски], по-русски произносится [а́ски]. Ниже приводится вся таблица ASCII, коды в которой указаны в десятичном виде. По ней можно определить, что когда вы вводите с клавиатуры, скажем, символ “*”, компьютер его воспринимает как код 42(10), в свою очередь 42(10)=101010(2) – это и есть двоичный код символа “*”. Коды с 0 по 31 в этой таблице не задействованы.

  
 

 Таблица  символов ASCIIкод Символ код Символ код символ код символ код символ код символ
32 Пробел 48 . 64 @ 80 P 96 ' 112 p
33 ! 49 0 65 A 81 Q 97 a 113 q
34 " 50 1 66 B 82 R 98 b 114 r
35 # 51 2 67 C 83 S 99 c 115 s
36 $ 52 3 68 D 84 T 100 d 116 t
37 % 53 4 69 E 85 U 101 e 117 u
38 & 54 5 70 F 86 V 102 f 118 v
39 ' 55 6 71 G 87 W 103 g 119 w
40 ( 56 7 72 H 88 X 104 h 120 x
41 ) 57 8 73 I 89 Y 105 i 121 y
42 * 58 9 74 J 90 Z 106 j 122 z
43 + 59 : 75 K 91 [ 107 k 123 {
44 , 60 ; 76 L 92 \ 108 l 124 |
45 - 61 < 77 M 93 ] 109 m 125 }
46 . 62 > 78 N 94 ^ 110 n 126 ~
47 / 63 ? 79 O 95 _ 111 o 127 DEL

Таблица 6.

 Чтобы хранить также и коды национальных символов каждой страны (в нашем случае – символов кириллицы) требуется добавить еще 1 бит, что увеличит количество уникальных комбинаций из нулей и единиц вдвое, т.е. в нашем распоряжении дополнительно появится 128 свободных кодов (со 128-го по 255-й), в соответствие которым можно поставить символы русского алфавита.

 Таким образом,  отведя под хранение информации  о коде каждого символа 8 бит,  мы получим N=28=256 уникальных двоичных  кодов, что достаточно, чтобы закодировать  все символы, которые можно ввести с клавиатуры.

 Так мы  подошли к необходимости познакомиться  с еще одной базовой единицей  измерения – байтом.

Байт - последовательность из 8 бит.

1 байт = 23 бит  = 8 бит.

На основании  одного байта можно получить 28=256 уникальных двоичных кодов.

 В современных  кодировочных таблицах под хранение  информации о коде каждого символа отводится 1 байт.

1 символ = 1 байт.

В байтах измеряется объем данных (V) при их хранении и  передаче по каналам связи. Например, текст “Добрый день!” занимает объем равный 12 байтам.

 Биты в  байте нумеруются с конца с  0-го по 7-й. Минимальная комбинация  на основании одного байта  – восемь нулей, максимальная – восемь единиц. Рис. 18а.

11111111(2)=27+26+25+24+23+22+21+20=128+64+32+16+8+4+2+1=255(10)

 При хранении  на физическом уровне каждый  байт может быть реализован, например, на базе восьми конденсаторов,  каждый из которых либо разряжен (0), либо заряжен (1). Рис. 18b.

      

Рис. 6а. Байт: минимальная и    Рис. 6b. Байт: соответствие двоичного           максимальная комбинации                   числа и электрического импульса. 
 

Возвращаясь к  кодировочным таблицам, заметим, что  на сегодняшний день в использовании  не одна, а несколько кодировочных таблиц, включающих коды кириллицы, –  это стандарты, выработанные в разные годы и различными учреждениями. В  этих таблицах различен порядок, в котором  расположены друг за другом символы  кирилличного алфавита, поэтому одному и тому же коду соответствуют разные символы. По этой причине, мы иногда сталкиваемся с текстами, которые состоят из русских букв, но в бессмысленной  для нас последовательности.

 Например, текст  “Компьютерные вирусы”, введенный  в кодировке Windows-1251 в кодировке  КОИ-8 будет отображен так: ”лПНРШАФЕТОШЕ ЧЙТХУЩ”.

Эта проблема разрешима - на каждом компьютере найдутся все  основные кодировочные таблицы, и если тест выглядит неадекватно, нужно попробовать  перекодировать его, просто указав использовать другую кодировочную таблицу. Но наличие  такой проблемы, конечно, вносит неудобства.

 Используя  8-битную кодировочную таблицу  мы не сможем адекватно увидеть  на мониторе и тексты, созданные  на тех языках, где используются  символы, отличные от латинских и кирилличных, например символы с умляутами в немецком языке.  

1.9. Единицы измерения объема данных и ёмкости памяти: килобайты, мегабайты, гигабайты… 

 Итак, в мы  выяснили, что в большинстве современных  кодировок под хранение на  электронных носителях информации  одного символа текста отводится  1 байт. Т.е. в байтах измеряется объем, занимаемый данными при их хранении и передаче (файлы, сообщения).

Объем данных – количество байт, которое требуется для их хранения в памяти электронного носителя информации.

 Память носителей  в свою очередь имеет ограниченную  ёмкость, т.е. способность вместить  в себе определенный объем.  Ёмкость памяти электронных носителей  информации, естественно, также измеряется  в байтах.

 Однако байт  – мелкая единица измерения  объема данных, более крупными  являются килобайт, мегабайт, гигабайт, терабайт…

 Следует запомнить,  что приставки “кило”, “мега”, “гига”… не являются в данном случае десятичными. Так “кило” в слове “килобайт” не означает “тысяча”, т.е. не означает “103”. Бит – двоичная единица, и по этой причине в информатике удобно пользоваться единицами измерения кратными числу “2”, а не числу “10”. 

1 байт = 23 =8 бит, 1 килобайт = 210 = 1024 байта. В двоичном  виде 1 килобайт = &10000000000 байт. 

 Т.е. “кило”  здесь обозначает ближайшее к  тысяче число, являющееся при  этом степенью числа 2, т.е. являющееся  “круглым” числом в двоичной  системе счисления.

Именование  Обозначение              Значение в байтах
килобайт  1 Кb                                  210 b 1 024 b
мегабайт  1 Mb                                  210 Kb = 220  b 1 048 576 b
гигабайт  1 Gb                                   210 Mb = 230 b 1 073 741 824 b
терабайт                                        1 Tb        210 Gb = 240  b 1 099 511627 776 b

Таблица 7. 

1.10. Кодирование графической информации

 Графическая  информация, как и информация  любого другого типа, хранятся  в памяти компьютера в виде  двоичных кодов. Изображение,  состоящее из отдельных точек,  каждая из которых имеет свой  цвет, называется растровым изображением. Минимальный элемент такого изображения  в полиграфии называется растр,  а при отображении графики  на мониторе минимальный элемент  изображения называют пиксель  (pix).

                                                  Пиксель                                                                            Растр

 Рис. 7. Минимальная единица изображения: пиксель и растр.

 Если пиксель изображения может быть раскрашен только в один из 2х цветов, допустим, либо в черный (0), либо в белый (1), то для хранения информации о цвете пикселя достаточно 1 бита памяти (log2(2)=1 бит). Соответственно, объем, занимаемый в памяти компьютера всем изображением, будет равен числу пикселей в этом изображении (рис. 20а).

 Если под  хранение информации о цвете  пикселя выделить 2 бита, то число  цветов, допустимых для раскраски  каждого пикселя, увеличится до 4х (N=22=4), а объем файла изображения  в битах будет вдвое больше, чем количество составляющих  его пикселей (рис. 20b).  

Рис. 8a. 1 бит на пиксель – 2 цвета. Рис. 8b. 2 бита на пиксель – 4 цвета.

При печати на не цветном принтере обычно допускает 256 градаций серого цвета (от черного (0) до белого (255)) для раскраски каждой точки изображения. Под хранение информации о цвете точки в  этом случае отводится 1 байт, т.е. 8 бит (log2(256)=8 бит). 
 
 
 
 
 
 
 
 
 
 
 
 

  1. Практическое  задание №2
 

    Создать папку  «Информатика», в которой создать папку “Word”, затем в текстовом процессоре “Word” создать файл с произвольным текстом, включающем 2 абзаца, имеющий имя Текст.doc , сохранить данный файл в папке «Информатика».

     Порядок выполнения:

  1. В месте, где необходимо создать папку нужно нажать правой кнопкой мыши.
  2. В появившемся контекстном меню выбрать “Создать” – Папку
  3. По умолчанию она будет названа Новая папка, чтоб ее переименовать, можно на ней вызвать контекстное меню и выбрать “Переименовать”.
  4. Для того чтобы создать текстовый документ в процессоре “Word”, нужно нажать меню Пуск – Все программы – Microsoft Office - Microsoft Office Word
  5. В открывшийся документ внести произвольный текст включающий в себя 2 абзаца.
  6. В документе на панели управления нажать “Фаил” – Сохранить как…
  7. В открывшемся диалоговом окне ввести Имя фаила – Текст, указать расширение DOC и сохранить документ в Папке «Информатика».
Кодирование чисел, символов и графической информации, единицы измерения данных