Язык как способ представления информации

ВВЕДЕНИЕ

    Слово "информация" происходит от латинского слова informatio, что в переводе означает сведение, разъяснение, ознакомление. Понятие «информация» является базовым  в курсе информатики, невозможно дать его определение через другие, более «простые» понятия.

    В случае с понятием «информация» проблема его определения еще более  сложная, так как оно является общенаучным понятием. Данное понятие  используется в различных науках (информатике, кибернетике, биологии, физике и др.), при этом в каждой науке  понятие «информация» связано с различными системами понятий.

    Человек - существо социальное, для общения  с другими людьми он должен обмениваться с ними информацией, причем обмен  информацией, всегда производится на определенном языке — русском, английском и так далее. Участники дискуссии должны владеть тем языком, на котором ведется общение, тогда информация будет понятной всем участникам обмена информацией.

    Для обмена информацией с другими  людьми человек использует естественные языки (русский, английский, китайский и др.), то есть информация представляется с помощью естественных языков. В основе языка лежит алфавит, то есть набор символов (знаков), которые человек различает по их начертанию. В основе русского языка лежит кириллица, содержащая 33 знака, английский язык использует латиницу (26 знаков), китайский язык использует алфавит из десятков тысяч знаков (иероглифов).

    Последовательности  символов алфавита в соответствии с  правилами грамматики образуют основные объекты языка — слова. Правила, согласно которым образуются предложения из слов данного языка, называются синтаксисом. Необходимо отметить, что в естественных языках грамматика и синтаксис языка формулируются с помощью большого количества правил, из которых существуют исключения, так как такие правила складывались исторически.

    Наряду  с естественными языками были разработаны формальные языки (системы  счисления, язык алгебры, языки программирования и др.). Основное отличие формальных языков от естественных состоит в  наличии строгих правил грамматики и синтаксиса.

    Например, системы счисления можно рассматривать  как формальные языки, имеющие алфавит (цифры) и позволяющие не только именовать  и записывать объекты (числа), но и  выполнять над ними арифметические операции по строго определенным правилам. Некоторые языки используют в качестве знаков не буквы и цифры, а другие символы, например химические формулы, ноты, изображения элементов электрических или логических схем, дорожные знаки, точки и тире (код азбуки Морзе) и другие.

    Знаки могут иметь различную физическую природу. Например, для представления информации с использованием языка в письменной форме используются знаки, которые являются изображениями на бумаге или других носителях, в устной речи в качестве знаков языка используются различные звуки (фонемы), а при обработке текста на компьютере знаки представляются в форме последовательностей электрических импульсов (компьютерных кодов) 
 
 
 
 
 
 
 
 

       ЯЗЫК КАК СПОСОБ  ПРЕДСТАВЛЕНИЯ ИНФОРМАЦИИ.

ДВОИЧНАЯ  ФОРМА ПРЕДСТАВЛЕНИЯ  ИНФОРМАЦИИ.

    Понятие информация является одним из фундаментальных в современной науке вообще и базовым для изучаемой ними информатики. Информацию рассматривают в качестве важнейшей сущности мира, в котором мы живем.

    Язык  – это средство отражения и  познания окружающего мира. Информационный процесс может осуществляться только при наличии языка.

    Язык  – универсальное средство передачи информации. В простейшем бытовом понимании с термином «информация» обычно ассоциируются некоторые сведения, данные, знания и тому подобное. Информация передается в виде сообщений, определяющих форму и представление передаваемой информации. При этом предполагается что имеется «источник информации» и «получатель информации». Информацию об окружающем нас реальном мире мы получаем в виде набора символов или сигналов. Но если эти символы или сигналы никому не понятны, то информация бесполезна. Необходим язык общения - знаковый способ представления информации.

    Основа  языка - алфавит - некоторый конечный упорядоченный набор символов или сигналов. Примеры алфавитов: латинский (26 символов), русский (33 символа), арабские цифры, азбука Морзе и так далее. В информатике и информационных технологиях термин «язык» имеет свое значение: совокупность символов, соглашений и правил, используемых для отображения и передачи информации, средство описания данных и алгоритмов решения задач.

    В зависимости от задач, которые мы перед собой ставим, можно использовать разные способы представления информации.  
Некоторый набор символов алфавита образует слово, а число этих символов есть его длина. От изменения длины слова, очевидно, будет меняться и информация, заключенная в нем. Чтобы разобраться в изменениях информации, необходима ее оценка (измерение).

    Одно  и та же информация может существовать в различных формах. Для представления  информации удобно использовать знаковые системы. Знаковая система состоит из определенного набора знаков и из правил работы с ними.

    Знак  – это сущность, имеющая некоторый  смысл и некоторый внешний  вид. Физический носитель знака может  быть различным: для передачи одного и того же знака может использоваться в устной речи – звук, в письменной речи – буква, в памяти компьютера – последовательность электрических импульсов.

    Процесс перевода информации из одной формы  представления в другую называют кодированием информации. С помощью двух цифр можно закодировать любое сообщение. Достоинство двоичного кодирования – простота реализации. Недостаток – длинные коды. Но в технике легче иметь дело с большим числом простых однотипных элементов, чем с большим числом сложных.

    Двоичная  система используется в цифровой электронике, компьютерной технике. Двоичная система в современном представлении была полностью описана немецким философом и математиком Готтфридом Лейбницем в XVII веке в работе «Explication de l’Arithmetique Binaire» («Объяснение бинарной арифметики»). Компьютер обрабатывает информацию только в закодированном виде.

    Кодирование и его теория своими корнями связаны  с древнейшим искусством тайнописи  или криптографии. Первой ориентированной на технику системой кодирования стала азбука Морзе. Это попытка двоичного кодирования, но здесь кроме двух символов - точка и тире - есть еще и третий символ - пробел (пауза). С той или иной степенью точности информацию можно разделить на небольшие элементарные части. Например, текст в книге состоит из букв, пробелов и других символов, рисунок из точек, музыка из отдельных звуков.

    В двоичной системе счисления всего  две цифры, называемые двоичными (binary digits). Сокращение этого наименования привело к появлению термина  бит, ставшего названием разряда  двоичного числа. Веса разрядов в  двоичной системе изменяются по степеням двойки. Поскольку вес каждого разряда умножается либо на 0, либо на 1, то в результате значение числа определяется как сумма соответствующих значений степеней двойки. Если какой - либо разряд двоичного числа равен 1, то он называется значащим разрядом.

    Создатели компьютера отдают предпочтение именно двоичной системе счисления, потому что в техническом устройстве наиболее просто реализовать два противоположных физических состояния. В компьютере «бит» является наименьшей возможной единицей информации. Объем информации, записанной двоичными знаками в памяти компьютера или на внешнем носителе информации подсчитывается просто по количеству требуемых для такой записи двоичных символов.

    Каждый  символ - это элементарная часть  информации. Информация будет закодированной, если любая ее элементарная часть представлена в виде числа или набора чисел. Перевод с одного языка на другой с помощью словаря, зашифровка сообщения, запись алгоритма на языке программирования меняют только форму представления, внешний вид информации.

    Для того чтобы при кодировании информация не потерялась и не исказилась, нужно  устанавливать соответствие между  двумя знаковыми системами. Составляют таблицы соответствия между знаками  или группами знаков. Такие таблицы  называются кодовыми. Язык является знаковой системой, соответственно в нем имеется набор знаков и список правил для работы с ними. Правила описывают способы составления из элементарных, основных знаков более сложных конструкций.

    Двоичная  система счисления является основной системой представления информации в памяти компьютера.

    Язык  некоторых компьютеров первого  поколения основывался только с 50 – х годов 20 – го века, начала применяться практически во всех вычислительных машинах двоичная система, это было обусловлено:

  1. Экономичностью аппаратной реализацией всех схем ЭВМ для радиоэлектронных элементов (радиоламп, полупроводниковых элементов), которые в основном используются в вычислительных машинах;
  2. Более простой реализацией алгоритмов выполнения арифметических и логорических операций;
  3. Более надежный физической реализацией основных функций, так как они имеют всего два состояния (0 и 1), это состояние надежно и помехоустойчиво.

             Бит - самое короткое слово двоичного алфавита, причем цифры 0 и 1 при этом равноправны. Количество информации в двоичном коде 10100111 равно 8 бит. Но 1 бит - это очень маленькое количество информации.

    Объем информации, записанной двоичными знаками  в памяти компьютера или на внешнем носителе информации подсчитывается просто по количеству требуемых для такой записи двоичных символов.

    Двоичное слово из восьми знаков содержит один байт информации, 1024 байта образуют килобайт, 1024 килобайта – мегабайт, а 1024 мегабайта – гигабайт.

    Двоичная  система используется в цифровых вычислительных устройствах, поскольку  является простой и удовлетворяет  следующим требованиям:

  1. Чем меньше значений существует в системе, тем проще изготовить отдельные элементы;
  2. Чем меньше количество состояний у элемента, тем выше помехоустойчивость и тем быстрее он может работать;
  3. Простота создания таблиц сложения и умножения – основных арифметических операций над числами.

    Система счисления в зависимости от способов изображения чисел делится на:

  1. Позиционные;
  2. Непозиционные.

    Примером  непозиционной системы счисления  может служить римская система, в которой для каждого числа  используется специфическое сочетание  символов, например ХIV, CXXVII и тому подобное.

    Позиционная система счисления определяется ее основанием – числом используемых в ней чисел. В позиционных системах значение каждой цифры определяется ее местом в числе, любое число может быть представлено суммой произведения цифры. Среди позиционных систем счисления наибольшее распространение имеет двоичная система счисления с основанием 2. В ней используются только две цифры 0 и 1 (да – нет, ложь – истина, включено – выключено, есть сигнал – нет сигнала и тому подобное).

    Переход от десятичной записи к двоичной осуществляется легко: десятичное число делится на два, затем на два делится частное, затем – новое частное и так до тех пор, пока не будет получено последнее частное (равное 1), причем каждый раз записывается остаток от деления. Выписав последнее частное (1) и вслед за ним в обратном порядке все остатки от деления исходного числа на два, мы получим двоичный эквивалент исходного числа. Чтобы записать двоичное число в десятичной системе, необходимо обратить процедуру: умножить первую цифру слева на 2, к полученному результату прибавить вторую цифру слева, полученную сумму прибавить к третьей цифре слева и так далее до тех пор, пока мы не прибавим последнюю (самую правую) цифру двоичного числа.

    Десятичное  число 6 в двоичной системе записывается как 0110 и расшифровывается так:

    0∙2³  + 1∙2² + 1∙2¹ + 0∙2º

    Для перевода необходимо разложить число  по основанию системы счисления  и посчитать результат.

    Например,

    

    Двоичное  число 1011 можно прочесть как десятичное 11:

    1∙2³ + 0∙2² + 1∙2¹ + 1∙2º

    Существуют  формальные правила перевода чисел  из одной  системы в другую, в частности, двоичного числа в десятичное и наоборот. Например, для перевода целого десятичного числа в двоичное нужно делить его пополам до тех пор, пока в остатке не образуется 0 и 1, а затем записать остатки справа налево.

    Первый  остаток – это младший нулевой разряд искомого числа. Последнее частное – старшая цифра искомого числа

    13: 2 = 6  + 1;

    6: 2 = 3 + 0;

    3: 2 = 1 + 1.

    Таким образом, 13 = 1101.

    Количество  цифр (бит) в числе определяет разрядность  числа. Биты в числе нумеруются справа, налево начиная с нулевого разряда.

    Общая формула для подсчета количества кодируемых значений в двоичной системе  счисления имеет вид:

    N = 2 m

    где N – количество кодируемых значений, m- число разрядов двоичной системы.

    Числа, записанные в двоичной системе, требуют большего числа знаков, чем их аналоги в десятичной системе, в двоичной, и в десятичной системе суть состоит в позиционном принципе записи чисел, поэтому ясно, что современные суперкомпьютеры стали возможны благодаря тому, что четыре тысячи лет назад в Месопотамии было совершено важнейшее открытие в области обозначения чисел. 

    В последние годы в области прикладной математики, особенно в компьютерах, очень важное значение приобрела  двоичная система счисления.  

Десятичная  система Двоичная  система Десятичная система Двоичная  система
0 0 9 1001
1 1 10 1010
2 10 11 1011
3 11 12 1100
4 100 13 1101
5 101 14 1110
6 110 15 1111
7 111 16 10000
8 1000    

    В двоичной системе число 6789 записывается в виде 1101010000101, то есть как

    

    Двоичной системой счисления пользовался в начале 17 века Т. Харриот. Позднее Г.Лейбниц обратил на двоичную систему внимание миссионеров, отправлявшихся для проповеди христианства в Китай в надежде убедить китайского императора в том, что Бог (единица) сотворил все из ничего (нуля). Однако вплоть до 20 века двоичную систему рассматривали как математический курьез, и время от времени раздавались предложения перейти от десятичной системы к восьмеричной или двенадцатеричной, но отнюдь не двоичной системе.

    Однако  именно в двоичной системе арифметические операции особенно просты. В двоичной системе не существует «таблицы сложения», которую нужно бы было запоминать, так как «перенос в старший разряд» начинается с 1 + 1 = 10. При сложении больших чисел необходимо лишь складывать по столбцам или разрядам, как в десятичной системе, памятуя лишь о том, что как только сумма в столбце достигает числа 2, двойка переносится в следующий столбец (влево) в виде единицы старшего разряда. Вычитание производится так же, как в десятичной системе, не задумываясь о том, что теперь в случае необходимости нужно «занимать» из столбца слева 2, а не 10.

    Умножение «столбиком» выполняется без  труда, так как необходимость  в «переносе в старший разряд»  отпадает, за исключением сложения частичных произведений при получении окончательного ответа. Однако за эту легкость приходится «платить» большим числом знаков при умножении даже небольших чисел. Деление «углом» в двоичной системе выполняется быстро, при этом нет необходимости в пробных делителях. По существу, деление становится своего рода непрерывным вычитанием, которое отличается необычайной «прозрачностью».

    ЗАКЛЮЧЕНИЕ

    Информацию  можно классифицировать разными  способами, и разные науки это  делают по-разному. Например, в философии  различают информацию объективную и субъективную. Объективная информация отражает явления природы и человеческого общества. Субъективная информация создается людьми и отражает их взгляд на объективные явления.

    В информатике отдельно рассматривается  аналоговая информация и цифровая. Это важно, поскольку человек благодаря своим органам чувств, привык иметь дело с аналоговой информацией, а вычислительная техника, наоборот, в основном, работает с цифровой информацией.

    Человек воспринимает информацию с помощью  органов чувств. Свет, звук, тепло – это энергетические сигналы, а вкус и запах – это результат воздействия химических соединений, в основе которого тоже энергетическая природа. Человек испытывает энергетические воздействия непрерывно и может никогда не встретиться с одной и той же их комбинацией дважды. Нет двух одинаковых зеленых листьев на одном дереве и двух абсолютно одинаковых звуков – это информация аналоговая. Если же разным цветам дать номера, а разным звукам – ноты, то аналоговую информацию можно превратить в цифровую.

    Кодирование информации – это процесс формирования определенного представления информации.

    В более узком смысле под термином «кодирование» часто понимают переход  от одной формы представления  информации к другой, более удобной  для хранения, передачи или обработки.

    Компьютер может обрабатывать только информацию, представленную в числовой форме. Вся  другая информация (звуки, изображения, показания приборов и т. д.) для  обработки на компьютере должна быть преобразована в числовую форму. Например, чтобы перевести в числовую форму музыкальный звук, можно через небольшие промежутки времени измерять интенсивность звука на определенных частотах, представляя результаты каждого измерения в числовой форме. С помощью компьютерных программ можно преобразовывать полученную информацию, например «наложить» друг на друга звуки от разных источников.

    Аналогично  на компьютере можно обрабатывать текстовую  информацию. При вводе в компьютер  каждая буква кодируется определенным числом, а при выводе на внешние  устройства (экран или печать) для восприятия человеком по этим числам строятся изображения букв. Соответствие между набором букв и числами называется кодировкой символов.

    Как правило, все числа в компьютере представляются с помощью нулей  и единиц (а не десяти цифр, как  это привычно для людей). Иными словами, компьютеры обычно работают в двоичной системе счисления, поскольку при этом устройства для их обработки получаются значительно более простыми. 
 
 
 
 
 
 
 
 

СПИСОК  ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

  1. Брукшир Д.Ж. Информатика и вычислительная техника. 7-ое издание. Питер 2004 год. 620 страниц;
  2. Гуда А.Н., Бутакова М.А., Нечитайло Н.М, Чернов А.В. Информатика. Общий курс. Ростов на Дону 2008 год. 400 страниц;
  3. Мобилев А.В. Информатика. Учебное пособие для студентов педагогических вузов. Москва 1999 год. 816 страниц;
  4. Пачкин С.Г. Вычислительные машины, системы и сети. Кемерово 2009 год. 196 страниц;
  5. Степанов А.Н. Информатика. Учебник для вузов. 5-ое издание. Питер 2007 год. 756 страниц;
  6. Соболь Б.В. Информатика. Учебник. Ростов на Дону 2006 год. 448 страниц.
Язык как способ представления информации