Основные подходы и принципы классификации информации
22
Сибирский университет потребительской кооперации
Сформулируйте основные подходы и принципы классификации информации.
Термин «информация» происходит от латинского слова information, означающего разъяснение, изложение, осведомление.
В различных науках, использующих понятие «информация», можно выделить три подхода к феномену информации:
1. Атрибутивный подход полагает информацию всеобщим свойством материи, проявляющимся во взаимодействии; неотъемлемым, вечно существующим атрибутом всех систем объективной реальности, организующим началом в живой и неживой природе. Такой подход, близкий к философскому пониманию информации, нашел развитие в физике, системологии.
2. Функциональный подход предполагает, что информация и информационные процессы возникают лишь на определенной стадии развития форм движения материи, тем самым этот подход отрицает существование информации в неживой природе. Согласно данному подходу, информация через информационные процессы реализует информацию управления (самоуправления) в биологических, социальных и социотехнических (человеко-машинных) системах. Информация рассматривается как основное отличие живого от неживого. Такой подход к информации характерен для биологии, кибернетики.
3. Антропоцентристский подход ограничивает сферу применения понятия «информация» социальными и социотехническими системами. Информация определяется как содержание (смысл) сигнала или сообщения, полученного системой из внешнего мира. Информация как содержание воспринятого сигнала изучается в лингвистике, психологии, социологии. Информацию, понимаемую таким образом, часто называют семантической информацией.
В информатике отдельно рассматривают аналоговую информацию и цифровую.
Виды информации классифицируются:
1) по способу передачи и восприятия: зрительная, слуховая, тактильная, вкусовая, машинно-ориентированая;
2) по формам отображения: символьная, текстовая, графическая;
3) по содержанию (в зависимости от вида обслуживаемой человеческой деятельности): научная, производственная, управленческая, правовая;
4) для машинно-ориентированной информации характерны следующие формы представления: двоичная, текстовая, графическая, электронные таблицы, базы данных;
5) по виду представления информации подразделяется на одномерную и многомерную. Одномерная – сообщение, имеющее вид последовательности символов, каждый из которых несет только один признак, например, звуковые символы (речь). Многомерная – сообщение, в котором информацию несут не один, а множество признаков, например, текст (значение, цвет и шрифт написания знаков, алфавит), голос (аплитуда, тембр, высота звука).
Какова роль знака и языка при представлении информации?
Язык - множество символов и совокупность правил, определяющих способы составления из этих символов осмысленных сообщений. Семантика - система правил и соглашений, определяющая толкование и придание смысла конструкциям языка.
Кодирование информации - это процесс формирования определенного представления информации. При кодировании информация представляется в виде дискретных данных. Декодирование является обратным к кодированию процессом.
В более узком смысле под термином "кодирование" часто понимают переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки. Компьютер может обрабатывать только информацию, представленную в числовой форме. Вся другая информация (например, звуки, изображения, показания приборов и т. д.) для обработки на компьютере должна быть преобразована в числовую форму. Например, чтобы перевести в числовую форму музыкальный звук, можно через небольшие промежутки времени измерять интенсивность звука на определенных частотах, представляя результаты каждого измерения в числовой форме. С помощью программ для компьютера можно выполнить преобразования полученной информации.
Аналогичным образом на компьютере можно обрабатывать текстовую информацию. При вводе в компьютер каждая буква кодируется определенным числом, а при выводе на внешние устройства (экран или печать) для восприятия человеком по этим числам строятся изображения букв. Соответствие между набором букв и числами называется кодировкой символов.
Знаки или символы любой природы, из которых конструируются информационные сообщения, называют кодами. Полный набор кодов составляет алфавит кодирования. Простейшим алфавитом, достаточным для записи информации о чем-либо, является алфавит из двух символов, описывающих два его альтернативных состояния ("да" - "нет", "+" - "-", 0 или 1).
Как правило, все числа в компьютере представляются с помощью нулей и единиц (а не десяти цифр, как это привычно для людей). Иными словами, компьютеры обычно работают в двоичной системе счисления, поскольку при этом устройства для их обработки получаются значительно более простыми. Ввод чисел в компьютер и вывод их для чтения человеком может осуществляться в привычной десятичной форме, а все необходимые преобразования выполняют программы, работающие на компьютере.
Любое информационное сообщение можно представить, не меняя его содержания, символами того или иного алфавита или, говоря иначе, получить ту или иную форму представления. Например, музыкальная композиция может быть сыграна на инструменте (закодирована и передана с помощью звуков), записана с помощью нот на бумаге (кодами являются ноты) или намагничена на диске (коды - электромагнитные сигналы).
Способ кодирования зависит от цели, ради которой оно осуществляется. Это может быть сокращение записи, засекречивание (шифровка) информации, или, напротив, достижение взаимопонимания. Например, система дорожных знаков, флажковая азбука на флоте, специальные научные языки и символы - химические, математические, медицинские и др., предназначены для того, чтобы люди могли общаться и понимать друг друга. От того, как представлена информация, зависит способ ее обработки, хранения, передачи и т.д.
Компьютер с точки зрения пользователя работает с информацией самой различной формы представления: числовой, графической, звуковой, текстовой и пр. Но мы уже знаем (упоминалось выше), что он оперирует только цифровой (дискретной) информацией. Значит, должны существовать способы перевода информации из внешнего вида, удобного пользователю, во внутреннее представление, удобное компьютеру, и обратно.
Для обмена информацией с другими людьми человек использует естественные языки (русский, английский, китайский и др.), то есть информация представляется с помощью естественных языков. В основе языка лежит алфавит, то есть набор символов (знаков), которые человек различает по их начертанию. В основе русского языка лежит кириллица, содержащая 33 знака, английский язык использует латиницу (26 знаков), китайский язык использует алфавит из десятков тысяч знаков (иероглифов).
Последовательности символов алфавита в соответствии с правилами грамматики образуют основные объекты языка — слова. Правила, согласно которым образуются предложения из слов данного языка, называются синтаксисом. Необходимо отметить, что в естественных языках грамматика и синтаксис языка формулируются с помощью большого количества правил, из которых существуют исключения, так как такие правила складывались исторически.
Наряду с естественными языками были разработаны формальные языки (системы счисления, язык алгебры, языки программирования и др.). Основное отличие формальных языков от естественных состоит в наличии строгих правил грамматики и синтаксиса.
Например, системы счисления можно рассматривать как формальные языки, имеющие алфавит (цифры) и позволяющие не только именовать и записывать объекты (числа), но и выполнять над ними арифметические операции по строго определенным правилам.
Некоторые языки используют в качестве знаков не буквы и цифры, а другие символы, например химические формулы, ноты, изображения элементов электрических или логических схем, дорожные знаки, точки и тире (код азбуки Морзе) и др.
Знаки могут -иметь различную физическую природу. Например, для представления информации с использованием языка в письменной форме используются знаки, которые являются изображениями на бумаге или других носителях, в устной речи в качестве знаков языка используются различные звуки (фонемы), а при обработке текста на компьютере знаки представляются в форме последовательностей электрических импульсов (компьютерных кодов).
Поясните особенности знаний.
Знания - это специальная форма представления информации, позволяющая мозгу хранить, воспроизводить и понимать ее. Далеко не вся информация выступает в роли знания. Знания - это особая информация, зафиксированная и выраженная в языке. Типы отношений, определяющие связь знаний с внеязыковым миром, друг с другом и с системой человеческих действий подчиняются особым закономерностям - семантики, синтаксиса и прагматики.
Основные свойства знаний:
Внутренняя интерпретируемость. Вместе с элементом данных в ЭВМ хранится система имен. Это позволяет «знать», что хранится в памяти системы и уметь отвечать на запросы о содержании памяти..
Рекурсивная структурируемость. Информационные единицы могут расчленяться на более мелкие и объединяться в более крупные ( по аналогии с матрешкой).Для этого используются родо-видовые отношения и принадлежность элементов к определенному классу. (Число структурообразующих отношений - более 200 типов).
Взаимосвязь информационных единиц. Между единицами устанавливаются разнообразные отношения семантического и прагматического характера связей (явлений и фактов). Когда между единицами возникают такие отношения, фрагменты этой структуры выявляются новые информационные единицы.
Наличие семантического пространства. Оно характеризует близость-удаленность информационных единиц друг от друга. Знания на могут представлять собой бессистемное сборище единиц, они должны быть взаимосвязаны и взаимозависимы в семантическом пространстве.
Формы существования знаний:
- в памяти человека (эксперта)
- материализованные (канонизированные) - учебники, монографии
- полуформализованная структурированная модель (поле знаний)
- формализованное знание на языке представления.
Типы знаний:
Глубинные знания - результат обобщения первичных понятий в абстрактные структуры;
Мягкие знания - допускают множественные расплывчатые решения (например, выработка рекомендаций); совокупность глубинных и мягких знаний дает возможность создавать мощные базы знаний;
Поверхностные знания - совокупность эмпирических ассоциаций и отношений между понятиями предметной области для стандартных ситуаций;
Концептуальные знания - выражают свойства объектов, процессов и ситуаций через Понятия (базовые элементы) предметной области. Описание каждого Понятия включает описание его компонентов, указание взаимосвязи с другими компонентами, зависимости между Понятиями. Концептуальные знания - жесткие. Применяются при решении задач анализа;
Экспертные знания - знания специалистов предметной области, они аккумулируют накопленный опыт. Этот тип знаний играет наиболее важную роль в слабоструктурированных предметных областях. Они мягкие и поверхностные. Совместное использование концептуальных и экспертных знаний позволяет сочетать логические и ассоциативные суждения, решать сложные задачи при низких вычислительных затратах;
Синтаксические знания - характеризуют синтаксическую структуру объекта, которая не зависит от смысла используемых Понятий;
Семантические знания - содержат информацию, связанную с смыслом рассматриваемых объектов;
Прагматические знания - описывают объекты относительно целей решаемых задач.
Объясните цикл по выполнению команды.
Программа в ЭВМ реализуется центральным процессором (ЦП) посредством последовательного исполнения образующих эту программу команд. Действия, требуемые для выборки (извлечения из основной памяти) и выполнения команды, называют циклом команды. В общем случае цикл команды включает в себя несколько составляющих (этапов):
выборку команды;
формирование адреса следующей команды;
декодирование команды;
вычисление адресов операндов;
выборку операндов;
исполнение операции;
формирование признака результата;
запись результата.
Перечисленные этапы выполнения команды в дальнейшем будем называть стандартным циклом команды. Отметим, что не все из этапов присутствуют при выполнении любой команды (зависит от типа команды), однако этапы выборки, декодирования, формирования адреса следующей команды и исполнения операции имеют место всегда.
В определенных ситуациях возможны еще два этапа: косвенная адресация и реакция на прерывание.
Стандартный цикл команды.
Кратко охарактеризуем каждый из вышеперечисленных этапов стандартного цикла команды. При изучении данного материала следует учитывать, что приводимое описание имеет целью лишь дать представление о сущности каждого из этапов. В то же время распределение функций по разным этапам цикла команды и последовательность выполнения некоторых из них в реальных ЭВМ могут отличаться от излагаемых.
Этап выборки команды.
Цикл любой команды начинается с того, что центральный процессор извлекает команду из памяти, используя адрес, хранящийся в счетчике команд (СК). Двоичный код команды помещается в регистр команды (РК) и с этого момента становится «видимым» для процессора. Если длина команды совпадает с разрядностью ячейки памяти, то все понятно. Однако, система команд многих ЭВМ предполагает несколько форматов команд, причем в разных форматах команда может занимать 1, 2 или более ячеек, а этап выборки команды можно считать завершенным лишь после того, как в РК будет помещен полный код команды. Информация о фактической длине команды содержится в полях кода операции и способа адресации. Обычно эти поля располагают в первом слове кода команды, и для выяснения необходимости продолжения процесса выборки необходимо предварительное декодирование их содержимого. Такое декодирование может быть произведено после того, как первое слово кода команды окажется в РК. В случае многословного формата команды процесс выборки продолжается вплоть до занесения в РК всех слов команды.
Этап формирования адреса следующей команды.
Для большинства ЭВМ характерно размещение соседних команд программы в смежных ячейках памяти. Если извлеченная команда не нарушает естественного порядка выполнения программы, то для вычисления адреса следующей выполняемой команды достаточно увеличить содержимое счетчика команд на длину текущей команды, представленную количеством занимаемых кодом команды ячеек памяти. Длина команды, а также то, способна ли она изменить естественный порядок выполнения команд программы, выясняются в ходе ранее упоминавшегося предварительного декодирования. Если извлеченная команда способна изменить последовательность выполнения программы (команда условного или безусловного перехода, вызова процедуры и т.п), процесс формирования адреса следующей команды переносится на этап исполнения операции. В силу сказанного, в ряде ЭВМ рассматриваемый этап цикла команды следует не за выборкой команды, а находится в конце цикла.
Этап декодирования команды.
После выборки команды она должна быть декодирована, для чего ЦП расшифровывает находящийся в РК код команды. В результате декодирования выясняются следующие вопросы:
находится ли в РК полный код команды или требуется дозагрузка остальных слов команды;
какие последующие действия нужны для выполнения данной команды;
если команда использует операнды, то откуда они должны быть взяты (номер регистра или адрес ячейки основной памяти);
если команда формирует результат, то куда этот результат должен быть направлен.
Ответы на два первых вопроса дает расшифровка кода операции, результатом которой может быть унитарный код, где каждый разряд соответствует одной из команд. На практике вместо унитарного кода могут встретиться самые разнообразные формы представления результатов декодирования, например адрес ячейки специальной управляющей памяти, где хранится первая микрокоманда микропрограммы для реализации указанной в команде операции.
Полное выяснение всех аспектов команды, помимо расшифровки кода операции, требует также анализа адресной части команды, включая поле способа адресации.
По результатам декодирования производится подготовка электронных схем ЭВМ к выполнению предписанных командой действий.
Этап вычисления адресов операндов.
Этап имеет место, если в процессе декодирования команды выясняется, что команда использует операнды. Если операнды размещаются в основной памяти, осуществляется вычисление их исполнительных адресов, с учетом указанного в команде способа адресации. Так, в случае индексной адресации для получения исполнительного адреса производится суммирование содержимого адресной части команды и содержимого индексного регистра.
Этап выборки операндов.
Вычисленные на предыдущем этапе исполнительные адреса используются для считывания операндов из памяти и занесения в определенные регистры процессора. Например, в случае арифметической команды операнд после извлечения из памяти может быть загружен во входной регистр АЛУ. Однако чаще операнды предварительно заносятся в специальные вспомогательные регистры процессора, а их пересылка на вход АЛУ происходит на этапе исполнения операции.
Этап исполнения операции.
На этом этапе реализуется указанная в команде операция. В силу различия сущности каждой из команд ЭВМ, содержание этого этапа сугубо индивидуально.
Этап формирования признака результата.
На этом этапе определяется, каким получился результат операции. Результат может быть положительным, отрицательным, равным нулю и т.п. Сформированный признак заносится в регистр признака результата (РПР) для дальнейшего использования устройством управления.
Этап записи результата
Этап записи результата присутствует в цикле тех команд, которые предполагают занесение результата в регистр или ячейку основной памяти. Фактически его можно считать частью этапа исполнения, особенно для тех команд, которые помещают результат сразу в несколько мест.
Расскажите о характеристиках, формах и видах информационного ресурса.
Принципиальное значение в понимании информационного ресурса имеет форма существования и представления знаний. Здесь речь идет о понятийном знании – знании в смысловом выражении. Имеется, как известно, и другой вид знаний – знания интуитивные, рожденные в подсознательной сфере человека, которые, прежде чем стать сообщениями, должны быть выражены в виде понятий.
Знания, будучи живой, диалектической системой, передаются другим людям, материализуются и существуют в трех видах:
-«живые» знания (квалификация);
-овеществленные знания;
-информация (сообщения).
Каковы же основные особенности (характеристики) информационного ресурса?
Первая особенность информационного ресурса в отличии от других видов ресурсов (в частности, материальных), он практически неисчерпаем; по мере развития общества и роста потребления знаний их запасы не убывают, а растут.
Вторая особенность информационного ресурса: по мере использования он не исчезает, а сохраняется и даже увеличивается (за счет трансформации полученных сообщений с учетом опыта и местных условий).
Третья особенность информационного ресурса: он несамостоятелен и сам по себе имеет лишь потенциальное значение. Только соединяясь с другими ресурсами – опытом и квалификацией персонала, техникой, энергией, сыреем, - информационный ресурс проявляется как движущая сила.
Четвертая особенность информационного ресурса: эффективность его применения связана с эффектом повторного производства знаний. Информационное взаимодействие позволяет получить новое знание ценой значительно меньших затрат по сравнению с затратами труда, энергии, времени, затраченными на его полное генерирование.
Пятая особенность информационного ресурса: он является формой непосредственного включения науки в состав производственных сил. В индустриальном обществе наука выступает опосредованной производительной силой. Посредниками при этом служат машины, новые материалы и препараты. В информационном обществе наука представляет собой непосредственную производительную силу, выступая в форме информационного ресурса. Радикально изменяется характер действия информационного ресурса: производительность труда повышается не на проценты, а на порядки - на 10-100 раз. Осуществляется переход к производственным системам, основой функционирования которых служат информационный ресурс и информационные связи.
Шестая особенность информационного ресурса: он возникает в результате не просто умственного труда, а его творческой части. Рутинная часть умственной работы сама по себе не информативна: она не увеличивает потенциала нужных знаний, не меняет представления о путях достижения цели. Любой умственный труд, будь то наука или управление, включает две части: рутинную и творческую. Увеличение умственной работы за счет рутинной ее части не ведет к росту информационного ресурса. Вместе с тем трудовые и материально-энергетические затраты необходимы при выработке, передачи и использования информационного ресурса.
Существует две формы Информационного ресурса как отчуждаемых знаний, становящихся сообщениями: пассивная и активная.
К пассивным формам информационного ресурса относятся книги, журнальные статьи, патенты и базы данных, а также знания, привязанные к конкретным предметным областям (например, выборки, извлечения данных и т.п.), если они не комплексные, т.е. недостаточны для целенаправленного применения.
Активные формы информационного ресурса: модель, алгоритм, программа, проект и база знаний. Их можно трактовать в целом как стадии созревания, степени доведения его до готовности превращения в силу. Естественно, что каждая из этих форм информационного ресурса имеет разный научно-технический уровень и различную завершенность.
Модель – это описание системы, отображающее определенную группу ее свойств. Создание модели системы позволяет предсказать ее поведение в определенном диапазоне условий.
Алгоритмы подразделяют в зависимости от степени общности. Важно стремиться к созданию решаемых алгоритмов.
Программа и проект – конечные, синтетические формы существования информационного ресурса в его жизненном цикле.
Расскажите об информатике как о науке.
Информатика - молодая научная дисциплина, изучающая вопросы, связанные с поиском, сбором, хранением, преобразованием и использованием информации в самых различных сферах человеческой деятельности. Генетически информатика связана с вычислительной техникой, компьютерными системами и сетями, так как именно компьютеры позволяют порождать, хранить и автоматически перерабатывать информацию в таких количествах, что научный подход к информационным процессам становится одновременно необходимым и возможным.
Термин информатика возник в 60-х гг. во Франции для названия области, занимающейся автоматизированной обработкой информации с помощью электронных вычислительных машин. Французский термин образован путем слияния слов “информация” и “автоматика” и означает “информационная автоматика или автоматизированная переработка информации”. В англоязычных странах этому термину соответствует синоним computer science (наука о компьютерной технике).
Существует множество определений информатики, что связано с многогранностью ее функций, возможностей, форм, методов. Одно из наиболее общих определений такое.
Информатика – это область человеческой деятельности, связанная с процессами преобразования информации с помощью компьютеров и их взаимодействием со средой применения.
Информатика в широком смысле представляет собой единство разнообразных отраслей науки, техники и производства, связанных с переработкой информации.
Информатику в узком смысле можно представить как состоящую из трех взаимосвязанных частей.
Информатика как отрасль народного хозяйства состоит из однородной совокупности предприятий разных форм хозяйствования, где занимаются производством компьютерной техники, программных продуктов и разработкой современной технологии переработки информации. Специфика и значение информатики как отрасли производства состоят в том, что от нее во многом зависит рост производительности труда в других отраслях народного хозяйства. В настоящее время около 50% всех рабочих мест в мире поддерживается средствами обработки информации.
Информатика как фундаментальная наука занимается разработкой методологии создания информационного обеспечения процессов управления любыми объектами на базе компьютерных информационных систем. В Европе можно выделить следующие основные научные направления в области информатики: разработка сетевой структуры, компьютерно-интегрированные производства, экономическая и медицинская информатика, информатика социального страхования и окружающей среды, профессиональные информационные системы.
Информатика как прикладная дисциплина занимается:
изучением закономерностей в информационных процессах (накопление, переработка, распространение);
созданием информационных моделей коммуникаций в различных областях человеческой деятельности;
разработкой информационных систем и технологий в конкретных областях и выработкой рекомендаций относительно их жизненного цикла: для этапов проектирования и разработки систем, их производства, функционирования и т.д.
Главная функция информатики заключается в разработке методов и средств преобразования информации и их использовании в организации технологического процесса переработки информации.
Задачи информатики состоят в следующем:
исследование информационных процессов любой природы;
разработка информационной техники и создание новейшей технологии переработки информации на базе полученных результатов исследования информационных процессов;
решение научных и инженерных проблем создания, внедрения и обеспечения эффективного использования компьютерной техники и технологии во всех сферах общественной жизни.
Информатика существует не сама по себе, а является комплексной научно-технической дисциплиной, призванной создавать новые информационные техники и технологии для решения проблем в других областях. Комплекс индустрии информатики станет ведущим в информационном обществе. Тенденция к большей информированности в обществе в существенной степени зависит от прогресса информатики как единства науки, техники и производства.
Раскройте поколения ЭВМ по принципу элементной базы.
За относительно небольшой период своего развития ЭВМ прошли путь нескольких поколений. Каждое поколение ЭВМ характеризуется определенной совокупностью логической организации (архитектуры) и используемой конструктивно-технологической (главным образом элементной) базы.
Основным элементом ЭВМ первого поколения была электронная лампа. Промышленный выпуск и эксплуатация таких ЭВМ начались в 50-х годах.
Машины первого поколения были весьма громоздки, потребляли большое количество энергии и имели невысокую надежность. Их производительность не превышала 10—20 тыс. оп/с, а емкость основной памяти — 4 К машинных слов (где К = 210 = 1024). В ЭВМ первого поколения, по существу, не было системы программного обеспечения. Программирование было детализировано до уровня машинных команд и выполнялось пользователями на машинном языке данной ЭВМ. Пользователь также осуществлял ввод и отладку программ, обеспечивал управление вычислительным процессом при возникновении непредвиденных или недопустимых ситуаций.