Меры и единицы количества и объема информации. Формула Хартли. Формулы Шеннона

Министерство  образования и науки Российской Федерации

Федеральное государственное  бюджетное образовательное учреждение

высшего профессионального  образования

 

 

 

«Сибирский  государственный индустриальный университет»

Кафедра прикладной информатики

 

 

 

 

 

 

 

 

 

КОНТРОЛЬНАЯ РАБОТА № 1

 

Вариант № 5

 

 

 

 

                                                                                                               

 

 

 

 

 

 

 

 

Выполнил:

                                                                     ст.гр. ЗСП - 12

  Песков П.  А.

                                                                                  Шифр: ЗСП - 12123

                 

 

 

 

 

 

Новокузнецк

2012

Содержание

 

 

1 Меры и единицы количества и объема информации.  
Формула Хартли.  Формулы Шеннона.

 

 

1.1 Понятие информация

 

1.2  Свойства информации.

 

1.3  Виды (классификация)  информации

 

1.4  Общая характеристика  процессов сбора, передачи, обработки и накопления информации.

 

1.5  Количество информации: формулы Хартли и Шеннона.

 

 

 

 

2 Антивирусные программы. Назначение, классификация. Принцип работы. Базы антивирусов.

 

 

2.1  Определение антивирусная программа ( антивирус ).

 

2.2  Антивирусные программы, их назначение и классификация.

 

2.3  Принцип работы.

 

2.4 Основные базы данных антивирусов.

 

 

 

 

 

 

 

 

 

 

1. Меры и  единицы количества и объема информации 
Формула Хартли  Формулы Шеннона

 

1.1 Понятие  информации с точки зрения различных наук

 

В любой науке  основные понятия определить достаточно сложно. Так и понятие «информация» невозможно определить через другие, более «простые» понятия. В каждой науке оно связано с различными системами понятий. В зависимости от области знания существуют различные подходы к определению понятия «информация».

 Впервые  как научное понятие термин  «информация» стал применяться  в теории журналистики в 30-х годах ХХ века, хотя в исследованиях по библиотечному делу он появился еще раньше. Под информацией понимались различные сведения, сообщения. Что соответствует переводу с латинского языка informatio – сведение, разъяснение,  ознакомление.

В физике понятие информация рассматривается как антиэнтропия или энтропия с обратным знаком. Поскольку мерой беспорядка  термодинамической системы является энтропия системы, то информация (антиэнтропия) является мерой упорядоченности и сложности системы.

В неживой природе понятие информация связано с понятием отражения, отображения. В некоторых физических и химических теориях информация определяется как отраженное многообразие.

Под информацией  в технике понимают сообщение, передаваемое с помощью знаков и символов. В теории связи, например, под информацией принято понимать любую последовательность символов, не учитывая их смысл. В основанной американским ученым Клодом Шенноном математической теории информации под информацией понимались не любые сведения, а лишь те, которые снимают полностью или уменьшают существующую до их получения неопределенность (неизвестность).

 Понятие  информация используется в связи  с исследованием механизмов наследственности. В генетике сформулировано понятие генетической информации, которое определяется как программа (код) биосинтеза белков, представленных цепочками ДНК.

 Под информацией  в документолистике понимают все то, что так или иначе зафиксировано в знаковой форме в виде документов.

 В биологии, которая изучает живую природу, понятие «информация» связано с целесообразным поведением живых организмов. С точки зрения индивидуального человеческого сознания информация – это то, что поступает в наш мозг из многих источников в разных формах и, взаимодействуя там, образует структуру нашего знания. 

Под информацией в быту (житейский аспект) понимают сведения об окружающем мире и протекающем в нем процессах, воспринимаемые человеком или специальными устройствами.

1.2  Свойства информации

 

Все знания об окружающем мире человек получает с помощью органов чувств. Насколько мы им можем доверять?

Информация  нам нужна для того, чтобы принимать  правильные решения. Поэтому необходимо, чтобы она обладала следующими свойствами или качественными признаками:

1. Объективность информации. Информация объективна, если она не зависит от чьего-либо мнения. 

2. Достоверность. Информация достоверна, если она отражает истинное положение дел. Объективная информация всегда достоверна, но достоверная информация может быть как объективной, так и субъективной. Недостоверной информация может быть по следующим причинам:

1)    преднамеренное искажение (дезинформация);

2)    искажение в результате действия помех;

3)    когда значение отдельного факта или ряда фактов преуменьшается или преувеличивается (слухи, рыбацкие истории).

3.     Полнота информации. Информацию можно назвать полной, если ее достаточно для понимания и принятия решения. Неполная информация может привести к ошибочному выводу или решению. (Русская пословица «Недоученный хуже неученого»).

4.     Актуальность (своевременность) информации – важность, существенность для настоящего времени. Неактуальной может быть информация по двум причинам: 
   а)    она может быть устаревшей (прошлогодняя газета); 
    б)    незначимой, ненужной (сообщение: цены в Италии снижены на 5% ).

5.     Ценность (полезность или бесполезность) информации оценивается  применительно к задачам, которые можно решить с ее помощью. Самая ценная информация – это достаточно полезная, полная, объективная, достоверная и новая. Самая достоверная информация не может быть новой.

6.     Ясность, понятность. Информация понятна, если она выражена на языке, доступном для получателя.

 

1.3  Виды ( классификация ) информации

 

Некоторые представления  о разнообразии информации может  дать следующее определение (энциклопедический словарь).

Информация  – общенаучное понятие, включающее обмен сведениями между людьми, человеком  и автоматом, обмен сигналами  в животном и растительном мире; передачу признаков от клетки к клетки, от организма к организму. Из этого определения  следует существование 4 видов информации:

1. социальная (человек-человек);

2. техническая (человек-автомат, автомат-автомат);

3. биологическая (информация в живом и растительном мире);

4. генетическая (передача признаков от клетки к клетке, от организма к организму).

Другие основания  классификации информации:

· по способам и формам получения (восприятия);

· по характеру носителя;

· по характеру источника;

· по сфере применения;

· по общественному значению.

Около 90% всей информации человек получает при помощи органов зрения (визуальный), около 9% - при помощи органов слуха (аудиальный) и только около 1% - при помощи всех остальных органов чувств. Органы чувств получили название анализаторов, поскольку именно через это органы информация попадает в головной мозг.

 
Таблица 1 – Основные виды информации

 

информация

по способу  восприятия

по форме  представления

по общественному  значению

Визуальная 
       Аудиальная 
       Тактильная 
       Обонятельная           Вкусовая

Текстовая 
        Числовая 
       Графическая 
        Звуковая 
   Комбинированная

Массовая: 1.обыденная;                  
2. общественно-   политическая. 
 3.эстетическая. 
Специальная:  
1. научная; 
2.производственная; 
3. техническая; 
4. управленческая. 
Личная:  
1.знания; 
2. умения; 
3. интуиция.


 

1.4  Общая характеристика процессов  сбора, передачи, обработки 

и накопления информации

 

Сбор  информации – это процесс получения информации из внешнего мира и приведение ее к стандарту для данной информационной системы. Обмен информацией между воспринимающей ее системой и окружающей средой осуществляется посредством сигналов. Сигнал – средство передачи информации в пространстве и времени.

Передача  информации осуществляется различными способами: с помощью курьера, пересылка по почте, доставка транспортными средствами, дистанционная передача по каналам связи. Для осуществления последней, необходимы специальные технические средства.

Преобразование (обработка) информации – внесение изменений в набор данных, вычисления, информационный поиск, сортировка, построение графиков и тому подобное.

В современных  развитых информационных системах машинная обработка информации предполагает последовательно-параллельное во времени решение вычислительных задач. Это возможно при наличии определенной организации вычислительного процесса. Вычислительная задача по мере необходимости обращается с запросами в вычислительную систему. Организация процесса предполагает определение последовательности решения задач и реализацию вычислений.

Технология  электронной обработки информации – человеко-машинный процесс исполнения взаимосвязанных операций, протекающих в установленной последовательности с целью преобразования исходной информации (первичной) в результатную. Операция представляет собой комплекс совершаемых технологических действий, в результате которых информация преобразуется. Технологические операции разнообразны по сложности, назначению, технике реализации, выполняются на различном оборудовании разными исполнителями.

Хранение и накопление информации вызвано многократным ее использованием, применением постоянной информации, необходимостью комплектации первичных данных до их обработки. Хранение осуществляется на машинных носителях в виде информационных массивов, где данные располагаются по установленному в процессе проектирования группировочному признаку.

 

1.5  Количество информации: формулы Хартли и Шеннона

 

Какое количество информации содержится, к примеру, в  тексте романа "Война и мир", во фресках Рафаэля или в генетическом коде человека? Ответа на эти вопросы  наука не даёт и, по всей вероятности, даст не скоро. А возможно ли объективно измерить количество информации?

В теории информации количеством информации называют числовую характеристику сигнала, не зависящую  от его формы и содержания, и  характеризующую неопределенность, которая исчезнет после получения  сообщения в виде данного сигнала. В этом случае количество информации зависит от вероятности получения сообщения о том или ином событии.

В определенных, весьма широких условиях можно пренебречь качественными особенностями информации, выразить её количество числом, а также  сравнить количество информации, содержащейся в различных группах данных. В настоящее время получили распространение подходы к определению понятия "количество информации", основанные на том, что информацию, содержащуюся в сообщении, можно нестрого трактовать в смысле её новизны или, иначе, уменьшения неопределённости наших знаний об объекте.   Эти подходы используют математические понятия вероятности и логарифма.

 

Подходы к определению количества информации  Формулы Хартли и Шеннона

 

Американский  инженер Р. Хартли в 1928 г. процесс получения информации рассматривал как выбор одного сообщения из конечного наперёд заданного множества из N равновероятных сообщений, а количество информации I, содержащееся в выбранном сообщении, определял как двоичный логарифм N.

Формула  Хартли:   I = log2N

 

Допустим, нужно угадать одно число из набора чисел от единицы до ста. По формуле Хартли можно вычислить, какое количество информации для этого требуется: I = log2100 > 6,644. Таким образом, сообщение о верно угаданном числе содержит количество информации, приблизительно равное 6,644 единицы информации. Но не все ситуации имеют одинаковые вероятности реализации. Существует много таких ситуаций, у которых вероятности реализации различаются.

Для задач такого рода американский учёный Клод Шеннон предложил в1948 г. другую формулу определения количества информации, учитывающую возможную неодинаковую вероятность сообщений в наборе.

Формула Шеннона : I = — (  p1log2 p1 +p2 log2 p2 + . . . + pN log2 pN  ),

где   pi —  вероятность того, что именно i-е  сообщение выделено в наборе   из N cообщений.

Легко заметить, что если вероятности p1, ..., pN равны, то каждая из них 
равна 1 / N, и формула Шеннона превращается в формулу Хартли. Важно помнить, что любые теоретические результаты применимы лишь к определённому кругу случаев, очерченному первоначальными допущениями.

В качестве единицы информации Клод Шеннон предложил принять 
один  бит    (англ. bit — binary digit — двоичная цифра). Бит в теории информации — количество информации, необходимое для различения двух равновероятных сообщений   (типа "орел" —"решка", "чет"—"нечет" и т.п.). В вычислительной технике битом называют наименьшую "порцию" памяти компьютера, необходимую для хранения одного из двух знаков "0" и "1", используемых для внутримашинного представления данных и команд. Бит — слишком мелкая единица измерения. На практике чаще применяется более крупная единица —  байт,  равная  восьми битам. Именно восемь битов требуется для того, чтобы закодировать любой из 256 символов алфавита клавиатуры компьютера (256=28).

Широко используются также  ещё более крупные производные.

Единицы информации:

1 Килобайт (Кбайт) = 1024 байт = 210 байт,

1 Мегабайт (Мбайт) = 1024 Кбайт  = 220 байт,

1 Гигабайт (Гбайт) = 1024 Мбайт  = 230 байт.

В последнее время в  связи с увеличением объёмов  обрабатываемой информации входят в  употребление такие производные единицы, как: 

1 Терабайт (Тбайт) = 1024 Гбайт = 240 байт,

1 Петабайт (Пбайт) = 1024 Тбайт  = 250 байт.

За единицу информации можно было бы выбрать количество информации, необходимое для различения, например, десяти равновероятных сообщений.

Это будет не двоичная (бит), а десятичная (дит) единица информации.

 

2 Антивирусные  программы Назначение, классификация  Принцип работы Базы антивирусов

 

2.1  Определение  антивирусная программа ( антивирус  )

 

Антивирусная  программа (антивирус) — любая программа для обнаружения компьютерных вирусов, а также нежелательных (считающихся вредоносными) программ вообще и восстановления зараженных (модифицированных) такими программами файлов, а также для профилактики — предотвращения заражения (модификации) файлов или операционной системы вредоносным кодом.

Антивирусное  ПО, пришлось ждать недолго, оно появилось сразу после появления первых вредоносных программ. В нынешний момент над разработкой антивирусных программ трудятся целые корпорации во главе с тысячами людей, которые постоянно "латают дыры", чтоб наш информационный мир был более чистым и безопасным. Антивирусные программы (антивирусы) используют два определенных принципа работы (устранения) с вредоносным  ПО:

Сканирование  вашего компьютера и сопоставление уже 
имеющегося вируса с базой данных на сервере определенного производителя. Сканирование и обнаружение программ, которые ведут себя 
подозрительно и могут по определению являться вредоносным ПО.

Также можно  определить некоторую классификацию  антивирусных модулей, которые входят в составы различных антивирусных программ (антивирусов):

1.Сканеры — антивирусный модуль, который работает на основе 
сопоставления ( антивирус ищет наличие вируса по базе сигнатур ).

2. Ревизорный модуль — запоминает состояние файловой системы, что впоследствии, дает возможность сравнить отличия и сопоставить результаты. В случае отличия, вирус ловиться.

3.  Мониторы — это специальные программы помощники, которые в случае выявления потенциально опасного вредоносного ПО,  предлагают пользователю на выбор несколько операций, в число которых обязательно входит функция "удалить".

4.  Вакцины — принцип действия этого модуля, может напоминать нам 
обычную "прививку". Другими словами, когда вирус хочет проникнуть и заразить программу, то роль вакцины заключается в том, чтоб показать вирусу, что программа уже заражена. К сожалению, в данный момент, когда количество вирусов в глобальной сети измеряется миллионами, данный способ уже устарел.

 

2.2  Антивирусные программы, их назначение  и классификация

 

Классифицируются  антивирусные программы на чистые антивирусы и антивирусы двойного назначения ( рис. 1 ).

 

 

Рисунок 1 – Схема классификации антивирусных программ

 

Чистые антивирусы отличаются наличием антивирусного  ядра, которое выполняет функцию  сканирования по образцам. Принципиальным в этом случае является то, что возможно лечение, если известен вирус. Чистые антивирусы, в свою очередь, по типу доступа к файлам подразделяются на две категории: осуществляющие контроль по доступу (on access) или по требованию пользователя (on demand). Обычно on access-продукты называют мониторами, а on demand-продукты — сканерами.

Оn demand-продукт  работает по следующей схеме: пользователь хочет что-либо проверить и выдает запрос (demand), после чего осуществляется проверка. On access-продукт — это  резидентная программа, которая  отслеживает доступ и в момент доступа осуществляет проверку.

Кроме того, антивирусные программы, так же как и вирусы, можно разделить в зависимости  от платформы, внутри которой данный антивирус работает. В этом смысле наряду с Windows или Linux к платформам могут  быть отнесены Microsoft Exchange Server, Microsoft Office, Lotus Notes.

Программы двойного назначения — это программы, используемые как в антивирусах, так и в  ПО, которое антивирусом не является. Например, CRC-checker — ревизор изменений  на основе контрольных сумм — может  использоваться не только для ловли вирусов. Разновидностью программ двойного назначения являются поведенческие блокираторы, которые анализируют поведение других программ и при обнаружении подозрительных действий блокируют их. От классического антивируса с антивирусным ядром, распознающего и лечащего от вирусов, которые анализировались в лаборатории и которым был прописан алгоритм лечения, поведенческие блокираторы отличаются тем, что лечить от вирусов они не умеют, поскольку ничего о них не знают. Данное свойство блокираторов позволяет им работать с любыми вирусами, в том числе и с неизвестными. Это сегодня приобретает особую актуальность, поскольку распространители вирусов и антивирусов используют одни и те же каналы передачи данных, то есть Интернет.

При этом антивирусной компании всегда нужно время на то, чтобы получить сам вирус, проанализировать его и написать соответствующие лечебные модули. Программы из группы двойного назначения как раз и позволяют блокировать распространение вируса до того момента, пока компания не напишет лечебный модуль.

Классифицировать  антивирусные продукты можно и по следующим признакам.

По функционалу  продуктов:

Антивирусные  продукты (продукты, обеспечивающие только антивирусную защиту)

Комбинированные продукты (продукты, обеспечивающие не только защиту от вредоносных программ, но и фильтрацию спама, шифрование и резервное копирование данных и другие функции).

По целевым  платформам:

Антивирусные  продукты для ОС семейства Windows

Антивирусные  продукты для ОС семейства *NIX (к данному  семейству относятся ОС BSD, Linux, Mac OS X и др.)

Антивирусные  продукты для мобильных платформ (Windows Mobile, Symbian, iOS, BlackBerry, Android, Windows Phone 7 и другие).

Антивирусные  продукты для корпоративных пользователей  можно также классифицировать по объектам защиты.

Антивирусные  продукты для защиты рабочих станций.

Антивирусные  продукты для защиты файловых и терминальных серверов.

Антивирусные  продукты для защиты почтовых и Интернет-шлюзов.

Антивирусные  продукты для защиты систем.

 

2.3  Принцип работы антивирусных  программ

 

Самыми популярными  и эффективными антивирусными программами  являются антивирусные сканеры (другие названия: доктора, фаги, полифаги). Следом за ними по эффективности и популярности следуют CRC-сканеры (так-же: ревизор, checksumer, integrity checker). Часто оба приведенных метода объединяются в одну универсальную антивирусную программу, что значительно повышает ее мощность. Применяются также различного типа мониторы (фильтры, блокировщики) и иммунизаторы (детекторы).

Сканеры. Принцип работы антивирусных сканеров основан на проверке файлов, секторов и системной памяти и поиске в них известных и новых (неизвестных сканеру) вирусов. Сканеры также можно разделить на две категории - "универсальные" и "специализированные". Универсальные сканеры рассчитаны на поиск и обезвреживание всех типов вирусов вне зависимости от операционной системы, на работу в которой рассчитан сканер.

Специализированные  сканеры предназначены для обезвреживания ограниченного числа вирусов  или только одного их класса, например макро-вирусов. Специализированные сканеры, рассчитанные только на макро-вирусы, часто оказываются наиболее удобным  и надежным решением для защиты систем документооборота в средах MS Word и MS Excel

Сканеры также  делятся на "резидентные", производящие сканирование "на лету", и "нерезидентные", обеспечивающие проверку системы только по запросу.  CRC-сканеры. Принцип работы CRC-сканеров основан на подсчете CRC-сумм (контрольных сумм) для присутствующих на диске файлов/системных секторов. Эти CRC-суммы затем сохраняются в базе данных антивируса, как, впрочем, и некоторая другая информация: длины файлов, даты их последней модификации и т.д. При последующем запуске CRC-сканеры сверяют данные, содержащиеся в базе данных, с реально подсчитанными значениями. Если информация о файле, записанная в базе данных, не совпадает с реальными значениями, то CRC-сканеры сигнализируют о том, что файл был изменен или заражен вирусом.

Мониторы. Антивирусные мониторы - это резидентные программы, перехватывающие "вирусо-опасные" ситуации и сообщающие об этом пользователю. К "вирусо-опасным" относятся вызовы на открытие для записи в выполняемые файлы, запись в загрузочные сектора дисков, попытки программ остаться резидентно и т.д., то есть вызовы, которые характерны для вирусов в моменты из размножения.

Иммунизаторы. Иммунизаторы делятся на два типа: иммунизаторы, сообщающие о заражении, и иммунизаторы, блокирующие заражение каким-либо типом вируса. Первые обычно записываются в конец файлов (по принципу файлового вируса) и при запуске файла каждый раз проверяют его на изменение. Недостаток у таких иммунизаторов всего один, что он летален: абсолютная неспособность сообщить о заражении стелс-вирусом.

 

2.4 Основные  базы данных антивирусов

 

Для использования  антивирусов необходимы постоянные обновления так называемых баз антивирусов. Они представляют собой информацию о вирусах — как их найти и обезвредить. Поскольку вирусы пишут часто, то необходим постоянный мониторинг активности вирусов в сети. Для этого существуют специальные сети, которые собирают соответствующую информацию. После сбора этой информации производится анализ вредоносности вируса, анализируется его код, поведение, и после этого устанавливаются способы борьбы с ним. Чаще всего вирусы запускаются вместе с операционной системой. В таком случае можно просто удалить строки запуска вируса из реестра, и на этом в простом случае процесс может закончиться.

Более сложные  вирусы используют возможность заражения  файлов. Например, известны случаи, как  некие даже антивирусные программы, будучи зараженными, сами становились  причиной заражения других чистых программ и файлов. Поэтому более современные  антивирусы имеют возможность защиты своих файлов от изменения и проверяют их на целостность по специальному алгоритму.

Таким образом, вирусы усложнились, как и усложнились  способы борьбы с ними. Сейчас можно  увидеть вирусы, которые занимают уже не десятки килобайт, а сотни, а порой могут быть и размером в пару мегабайт. Обычно такие вирусы пишут в языках программирования более высокого уровня, поэтому их легче остановить.

Но по-прежнему существует угроза от вирусов, написанных на низкоуровневых машинных кодах наподобие ассемблера. Сложные вирусы заражают операционную систему, после чего она становится уязвимой и нерабочей. К сожалению, по прогнозам, в ближайшем будущем работа антивирусных компаний сильно осложнится в связи с тем, что будут сильнее распространяться вирусы с защитой от копирования.

 

Обзор наиболее популярных персональных антивирусов

 

Антивирус Касперского Personal Pro  — одно из наиболее популярных решений на российском рынке и  содержит целый ряд уникальных технологий. Поведенческий блокиратор модуль Office Guard держит под контролем выполнение макросов, пресекая все подозрительные действия. Наличие модуля Office Guard дает стопроцентную защиту от макровирусов.

Doctor Web - известный  антивирус  представляет собой  комбинацию антивирусного сканера  Doctor Web и резидентного сторожа SpIDer Guard, интегрированного в операционную систему компьютера. Один из самых совершенных в мире эвристических анализаторов Doctor Web в сочетании с ежедневно обновляющимися вирусными базами представляет собой надежную защиту от вирусов, троянских коней, почтовых червей и иных видов вредоносного программного кода.

Norton AntiVirus 2003 Professional Edition. Программа имеет ряд новых возможностей: защиту от вирусов в приложениях Instant messenger; блокировку червей (Worm Blocking), которая позволяет защитить исходящую почту и предотвратить инфицирование компьютеров третьих лиц, а также парольную защиту настройки опций в Norton AntiVirus.

McAfee VirusScan Professiona l 6.0  обеспечивает обнаружение  и удаление около 60 тыс. вирусов, троянских программ, червей, вредоносных Java-аплетов и ActiveX. Особенности программы: постоянная проверка всех точек входа, включая сетевые диски, CD-ROM, электронную почту и загружаемые из Интернета файлы; ядро обнаружения подозрительной активности сигнализирует о необычных действиях, предотвращая разрушительные последствия и обеспечивая бесперебойную работу ПК; автоматическое обновление антивирусных баз через Интернет; сканирование при синхронизации с карманными компьютерами (PDA); модуль для Palm OS для обеспечения полной защиты карманного компьютера; Антивирусная программа Аvast! v. home edition 4.7 русифицирована и имеет удобный интерфейс, содержит резидентный монитор, сканер, средства автоматического обновление баз и т.д.

Меры и единицы количества и объема информации. Формула Хартли. Формулы Шеннона