Кодирование информации. 5
ВЕДЕНИЕ
I. Информация и ее свойства
1. Информация и данные
2. Формы адекватности информации
3. Меры информации
4. Качество информации
II. Классификация и кодирование информации
1. Система классификации
2. Система кодирования
3. Классификация информации по разным признакам
ЗАКЛЮЧЕНИЕ
ЛИТЕРАТУРА
ВВЕДЕНИЕ
Существование области и предмета информатики немыслимо без ее основного ресурса - информации. Понимая информацию как один из основных стратегических ресурсов общества, необходимо уметь его оценить как с качественной, так и с количественной стороны. На этом пути существуют большие проблемы из-за нематериальной природы этого ресурса и субъективности восприятия конкретной информации различными индивидуумами человеческого общества.
I. ИНФОРМАЦИЯ И ЕЕ СВОЙСТВА
1. Информация и данные
Термин информация происходит от латинского information, что означает разъяснение, осведомление, изложение. С позиции материалистической философии информация есть отражение реального мира с помощью сведений (сообщений). Сообщение - это форма представления информации в виде речи, текста, изображения, цифровых данных, графиков, таблиц и т.п. В широком смысле информация - это общенаучное понятие, включающее в себя обмен сведениями между людьми, обмен сигналами между живой и неживой природой, людьми и устройствами.
Информация - сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень неопределенности, неполноты знаний.
Информатика рассматривает
информацию как концептуально связанные
между собой сведения, данные, понятия,
изменяющие наши представления о
явлении или объекте
Данные могут рассматриваться как признаки или записанные наблюдения, которые по каким-то причинам не используются, а только хранятся. В том случае, если появляется возможность использовать эти данные для уменьшения неопределенности о чем-либо, данные превращаются в информацию. Поэтому можно утверждать, что информацией являются используемые данные.
Одной из важнейших разновидностей информации является информация экономическая. Ее отличительная черта - связь с процессами управления коллективами людей, организацией. Экономическая информация сопровождает процессы производства, распределения, обмена и потребления материальных благ и услуг. Значительная часть ее связана с общественным производством и может быть названа производственной информацией.
Экономическая информация - совокупность сведений, отражающих социально-экономические процессы и служащих для управления этими процессами и коллективами людей в производственной и непроизводственной сфере.
При работе с информацией всегда имеется ее источник и потребитель (получатель). Пути и процессы, обеспечивающие передачу сообщений от источника информации к ее потребителю, называются информационными коммуникациями.
Для потребителя информации очень важной характеристикой является ее адекватность.
Адекватность информации - это определенный уровень соответствия создаваемого с помощью полученной информации образа реальному объекту, процессу, явлению и т.п.
В реальной жизни вряд ли возможна ситуация, когда вы сможете рассчитывать на полную адекватность информации. Всегда присутствует некоторая степень неопределенности. От степени адекватности информации реальному состоянию объекта или процесса зависит правильность принятия решений человеком.
2. Формы адекватности информации
Адекватность информации может выражаться в трех формах: семантической, синтаксической, прагматической.
Синтаксическая адекватность. Она отображает формально-структурные характеристики информации и не затрагивает ее смыслового содержания. На синтаксическом уровне учитываются тип носителя и способ представления информации, скорость передачи и обработки, размеры кодов представления информации, надежность и точность преобразования этих кодов и т.п. Информацию, рассматриваемую только с синтаксических позиций, обычно называют данными, так как при этом не имеет значения смысловая сторона. Эта форма способствует восприятию внешних структурных характеристик, т.е. синтаксической стороны информации.
Семантическая (смысловая) адекватность. Эта форма определяет степень соответствия образа объекта и самого объекта. Семантический аспект предполагает учет смыслового содержания. На этом уровне анализируются те сведения, которые отражает информация, рассматриваются смысловые связи. В информатике устанавливаются смысловые связи между кодами представления информации. Эта форма служит для формирования понятий и представлений, выявления смысла, содержания информации и ее обобщения.
Прагматическая (потребительская) адекватность. Она отражает отношение информации и ее потребителя, соответствие информации цели управления, которая на ее основе реализуется. Проявляются прагматические свойства информации только при наличии единства информации (объекта), пользователя и цели управления. Прагматический аспект рассмотрения связан с ценностью, полезностью использования информации при выработке потребителем решения для достижения своей цели. С этой точки зрения анализируются потребительские свойства информации. Эта форма адекватности непосредственно связана с практическим использованием информации, с соответствием ее целевой функции деятельности системы.
3. Меры информации
Синтаксическая мера информации
Эта мера количества информации оперирует с обезличенной информацией, не выражающей смыслового отношения к объекту.
Объем данных Vд в сообщении измеряется количеством символов (разрядов) в этом сообщении. В различных системах счисления один разряд имеет различный вес и соответственно меняется единица измерения данных:
- в двоичной
системе счисления единица
- в десятичной
системе счисления единица
Количество информации I на синтаксическом уровне невозможно определить без рассмотрения понятия неопределенности состояния системы (энтропии системы). Действительно, получение информации о какой-либо системе всегда связано с изменением степени неосведомленности получателя о состоянии этой системы.
Часто информация
кодируется числовыми кодами в той
или иной системе счисления, особенно
это актуально при
N = mn,
Где N - число всевозможных отображаемых состояний;
m - основание
системы счисления (
n - число разрядов (символов) в сообщении.
Наиболее часто используются двоичные и десятичные логарифмы. Единицами измерения в этих случаях будут соответственно бит и дит.
Коэффициент (степень) информативности (лаконичность) сообщения определяется отношением количества информации к объему данных, т.е.
, причем 0 < Y < 1.
С увеличением Y уменьшаются объемы работы по преобразованию информации (данных) в системе. Поэтому стремятся к повышению информативности, для чего разрабатываются специальные методы оптимального кодирования информации.
Семантическая мера информации
Для измерения
смыслового содержания информации, т.е.
ее количества на семантическом уровне,
наибольшее признание получила тезаурусная
мера, которая связывает
Тезаурус - это совокупность сведений, которыми располагает пользователь или система.
В зависимости от соотношений между смысловым содержанием информации S и тезаурусом пользователя Sр изменяется количество семантической информации Iс, воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус.
Максимальное количество семантической информации Iс потребитель приобретает при согласовании ее смыслового содержания S со своим тезаурусом Sр (Sр = Sр opt), когда поступающая информация понятна пользователю и несет ему ранее не известные (отсутствующие в его тезаурусе) сведения.
Следовательно,
количество семантической информации
в сообщении, количество новых знаний,
получаемых пользователем, является величиной
относительной. Одно и то же сообщение
может иметь смысловое
При оценке семантического (содержательного) аспекта информации необходимо стремиться к согласованию величин S и Sр.
Относительной мерой количества семантической информации может служить коэффициент содержательности С, который определяется как отношение количества семантической информации к ее объему:
Прагматическая мера информации
Эта мера определяет
полезность информации (ценность) для
достижения пользователем поставленной
цели. Эта мера также величина относительная,
обусловленная особенностями
Таблица 1.Единицы измерения информации и примеры
| Мера информации | Единицы измерения | Примеры (для компьютерной области) | |
| Синтаксическая:
шенноновский подход компьютерный подход |
Степень уменьшения
неопределенности
Единицы представления информации |
Вероятность события
Бит, байт, Кбайт и т.д. |
|
| Семантическая | Тезаурус
Экономические показатели |
Пакет прикладных
программ, персональный компьютер, компьютерные
сети и т.д.
Рентабельность, производительность, коэффициент амортизации и т.д. |
|
| Прагматическая | Ценность использования | Емкость памяти,
производительность компьютера, скорость
передачи данных и т.д.
Денежное выражение Время обработки информации и принятия решений |
|
4. Качество информации
Возможность и
эффективность использования
Репрезентативность информации связана с правильностью ее отбора и формирования в целях адекватного отражения свойств объекта. Важнейшее значение здесь имеют:
- правильность
концепции, на базе которой
сформулировано исходное
- обоснованность
отбора существенных признаков
и связей отображаемого
Нарушение репрезентативности информации приводит нередко к существенным ее погрешностям.
Содержательность информации отражает семантическую емкость, равную отношению количества семантической информации в сообщении к объему обрабатываемых данных, т.е. C = IС/VД.
С увеличением содержательности информации растет семантическая пропускная способность информационной системы, так как для получения одних и тех же сведений требуется преобразовать меньший объем данных.
Наряду с коэффициентом содержательности С, отражающим семантический аспект, можно использовать и коэффициент информативности, характеризующийся отношением количества синтаксической информации (по Шеннону) к объему данных Y = I/VД.
Достаточность (полнота) информации означает, что она содержит минимальный, но достаточный для принятия правильного решения состав (набор показателей). Понятие полноты информации связано с ее смысловым содержанием (семантикой) и прагматикой. Как неполная, т.е. недостаточная для принятия правильного решения, так и избыточная информация снижает эффективность принимаемых пользователем решений.
Допустимость информации восприятию пользователя обеспечивается выполнением соответствующих процедур ее получения и преобразования. Например, в информационной системе информация преобразовывается к доступной и удобной для восприятия пользователя форме. Это достигается, в частности, и путем согласования ее семантической формы с тезаурусом пользователя.
Актуальность информации определяется степенью сохранения ценности информации для управления в момент ее использования и зависит от динамики изменения ее характеристик и от интервала времени, прошедшего с момента возникновения данной информации.
Своевременность информации означает ее поступление не позже заранее назначенного момента времени, согласованного с временем решения поставленной задачи.
Точность информации определяется степенью близости получаемой информации к реальному состоянию объекта, процесса, явления и т.п. Для информации, отображаемой цифровым кодом, известны четыре классификационных понятия точности:
- формальная
точность, измеряемая значением
единицы младшего разряда
- реальная точность,
определяемая значением
- максимальная
точность, которую можно получить
в конкретных условиях
- необходимая точность, определяемая функциональным назначением показателя.
Достоверность информации определяется ее свойством отражать реально существующие объекты с необходимой точностью. Измеряется достоверность информации доверительной вероятностью необходимой точности, т.е. вероятностью того, что отображаемое информацией значение параметра отличается от истинного значения этого параметра в пределах необходимой точности.
Устойчивость информации отражает ее способность реагировать на изменения исходных данных без нарушения необходимой точности. Устойчивость информации, как и репрезентативность, обусловлена выбранной методикой ее отбора и формирования.
В заключение следует
отметить, что такие качества информации,
как репрезентативность, содержательность,
достаточность, устойчивость, целиком
определяются на методическом уровне
разработки информационных систем. Параметры
актуальности, своевременности, точности
и достоверности
II. КЛАССИФИКАЦИЯ И КОДИРОВАНИЕ ИНФОРМАЦИИ
1. Система классификации
Важным понятием при работе с информацией является классификация объектов.
Классификация - система распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком.
Под объектом понимается любой предмет, процесс, явление материального или нематериального свойства. Система классификации позволяет сгруппировать объекты и выделить определенные классы, которые будут характеризоваться рядом общих свойств. Классификация объектов - это процедура группировки на качественном уровне, направленная на выделение однородных свойств. Применительно к информации как к объекту классификации выделение классы называют информационными объектами.
Свойства информационного объекта определяются информационными параметрами, называемыми реквизитами. Реквизиты представляются либо числовыми данными, например вес, стоимость, год, либо признаками, например цвет, марка машины, фамилия.
Реквизит - логически неделимый информационный элемент, описывающий определенное свойство объекта, процесса, явления и т.п.
Кроме выявления общих свойств информационного объекта классификация нужна для разработки правил (алгоритмов) и процедур обработки информации, представленной совокупностью реквизитов.
При любой классификации желательно, чтобы соблюдались следующие требования:
- полнота охвата
объектов рассматриваемой
- однозначность реквизитов;
- возможность включения новых объектов.
В любой стране
разработаны и применяются
Классификатор - систематизированный свод наименований и кодов классификационных группировок.
При классификации широко используются понятия классификационный признак и значение классификационного признака, которые позволяют установить сходство или различие объектов. Возможен подход к классификации с объединением этих двух понятий в одно, названное как признак классификации. Признак классификации имеет также синоним основание деления.
Разработаны три метода классификации объектов: иерархический, фасетный, дескрипторный. Эти методы различаются разной стратегией применения классификационных признаков. Рассмотрим основные идеи этих методов для создания систем классификации.
Иерархическая система классификации
Иерархическая система классификации строится следующим образом:
- исходное множество элементов составляет 0-й уровень и делится в зависимости от выбранного классификационного признака на классы (группировки), которые образуют 1-й уровень;
- каждый класс
1-го уровня в соответствии
со своим, характерным для
- каждый класс
2-го уровня аналогично
Учитывая достаточно жесткую процедуру построения структуры классификации, необходимо перед началом работы определить ее цель, т.е. какими свойствами должны обладать объединяемые в классы объекты. Эти свойства принимаются в дальнейшем за признаки классификации.
В иерархической системе классификация из-за жесткой структуры особое внимание следует уделить выбору классификационных признаков.
В иерархической
системе классификации каждый объект
на любом уровне должен быть отнесен
к одному классу, который характеризуется
конкретным значением выбранного классификационного
признака. Для последующей группировки
в каждом новом классе необходимо
задать свои классификационные признаки
и их значения. Таким образом, выбор
классификационных признаков
Количество уровней классификации, соответствующие числу признаков, выбранных в качестве основания деления, характеризует глубину классификации.
Достоинства иерархической системы классификации:
- простота построения;
- использование независимых классификационных признаков в различных ветвях иерархической структуры.
Недостатки иерархической системы классификации:
- жесткая структура,
которая приводит к сложности
внесения изменений, так как
приходится перераспределять
- невозможность
группировать объекты по
Фасетная система классификации
Фасетная система классификации в отличие от иерархической позволяет выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемого объекта. Признаки классификации называются фасетами (facet - рамка). Каждый фасет (Фi) содержит совокупность однородных значений данного классификационного признака. Причем значения в фасете могут располагаться в произвольном порядке, хотя предпочтительнее их упорядочение.
Процедура классификации
состоит в присвоении каждому
объекту соответствующих
KS = (Ф1, Ф2, …, Фi, …, Фn),
где Фi - i-й фасет;
n - количество фасетов.
При построении фасетной системы классификации необходимо, чтобы значения, используемые в различных фасетах, не повторялись. Фасетную систему легко можно модифицировать, внося изменения в конкретные значения любого фасета.
Достоинства фасетной системы классификации:
- возможность
создания большой емкости
- возможность
простой модификации всей
Недостатком фасетной системы классификации является сложность ее построения, так как необходимо учитывать все многообразие классификационных признаков.
Дескрипторная система классификация
Для организации поиска информации, для ведения тезаурусов (словарей) эффективно используется дескрипторная (описательная) система классификации, язык которой приближается к естественному языку описания информационных объектов. Особенно широко она используется в библиотечной системе поиска.
Суть дескрипторного метода классификации заключается в следующем:
- отбирается
совокупность ключевых слов
- выбранные ключевые
слова и словосочетания
- создается словарь
дескрипторов, т.е. словарь ключевых
слов и словосочетаний, отобранных
в результате процедуры
Между дескрипторами устанавливаются связи, которые позволяют расширить область поиска информации. Связи могут быть трех видов:
- синонимические, указывающие некоторую совокупность ключевых слов как синонимы;
- родовидовые, отражающие включение некоторого класса объектов в более представительный класс;
- ассоциативные, соединяющие дескрипторы, обладающие общими свойствами.
2. Система кодирования
Система кодирования применяется для замены названия объекта на условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации.
Система кодирования - совокупность правил кодового обозначения объектов.
Код строится на базе алфавита, состоящего из букв, цифр и других символов. Код характеризуется:
- длиной - число позиций в коде;
- структурой - порядок расположения в коде символов, используемых для обозначения классификационного признака.
Процедура присвоения объекту кодового обозначения называется кодированием. Можно выделить две группы методов, используемых в системе кодирования, которые образуют:

- Кодирование информации (4)
- Кодирование информации в вычислительных машинах
- Кодирование информации. Кодирование чисел, текста, изображения и звука
- Кодирование информации. Современные методы кодирования
- Кодирование и сжатие аудио-информации
- Кодирование и шифрование
- Кодирование и шифрование
- Кодирование информации
- Кодирование информации
- Кодирование информации
- Кодирование информации
- Кодирование информации
- Кодирование информации
- Кодирование информации