Программы архиваторы. 2

СОДЕРЖАНИЕ

1.Введение 3

2.Программы архивации  4

3.Архивный файл 6

4.Архиваторы MS-DOS 7

4.1.PKZIP

7

4.2.ARJ

8

4.3.RAR

8

4.3.1.Введение

8

4.3.2.Технические характеристики 8

4.3.2.1.Степень сжатия

8

4.3.2.2.Дополнительные  возможности

9

4.3.3.Работа с RAR из  командной строки

9

4.3.3.1Формат вызова

9

4.3.3.2.Описание команд

10

4.3.3.3.Описание ключей

11

4.3.4.Работа с RAR в  полноэкранном режиме 14

4.3.4.1.Работа с файлами

14

4.3.4.2.Работа с архивами

15

4.3.4.3.Конфигурация

17

4.3.5.Ограничения

18

4.3.6.Непрерывные (solid) архивы

19

4.3.7.Работа с внешними  архивами 19

4.3.8.Коды завершения

20

4.3.9.Просмотр файлов  в RAR архиве

20

5.Архиваторы WINDOWS 21

5.1.WINRAR 2.5

21

5.2.WINZIP 7.0

23

5.2.1.Введение

23

5.2.2Работа с программой

24

5.2.3Рабочий интерфейс

26

6.Сравнительный тест  быстродействия и степени сжатия 28 
7.Список использованной литературы 29

Введение

При эксплуатации компьютера по самым разным причинам возможны порча или потеря информации на жестких  дисках. Это может произойти из-за физической порчи жесткого диска, неправильной корректировки или случайного уничтожения  файлов, разрушения информации компьютерным вирусом и т.д. Для того чтобы  уменьшить потери в таких ситуациях, следует иметь архивные копии  используемых файлов и систематически обновлять копии изменяемых файлов. 
Для сохранения информации можно конечно её дублировать, однако при этом копии занимают столько же места, сколько занимают исходные файлы, и для копирования нужных файлов может потребоваться много дискет. Например, для копирования файлов с жесткого диска емкостью 1,2 Гбайт необходимо 854 дискеты емкостью по 1,44 Мбайт. В таком большом количестве дискет даже разобраться довольно трудно, поэтому трудоемкость создания и обновления копии будет весьма значительной.

Более удобно использовать для создания копий специально разработанные  программы архивации файлов. Эти  программы позволяют не только сэкономить место на дискетах, но и объединять группы совместно используемых файлов в один архивный файл, что заметно  облегчает ведение архивов.

Принято различать  архивацию и упаковку (компрессию, сжатие) данных. В первом случае речь идет о слиянии нескольких файлов и даже каталогов в единый файл — архив (примером использования  такой технологии в чистом виде может  служить формат TAR). Во втором — о  сокращении объема исходных файлов путем  устранения избыточности (в данной работе рассматривается упаковка без  потерь информации, т. е. с возможностью точного восстановления исходных файлов). Как правило, современные архиваторы обеспечивают также сжатие данных, являясь, таким образом, еще и  упаковщиками, однако существуют и  чисто «упаковочные» утилиты  типа Gzip, сжимающие отдельные файлы, преобразуя их в формат Z или GZ. 
При выборе инструмента для работы с упакованными файлами и архивами следует учитывать два фактора: эффективность, т. е. оптимальный баланс между экономией дисковой памяти и производительностью работы, и совместимость, т. е. возможность обмена данными с другими пользователями. 
Совместимость, пожалуй, сегодня более важна, так как по достигаемой степени сжатия конкурирующие форматы и инструменты различаются на проценты (но не в разы), а вычислительная мощность современных компьютеров делает время обработки архивов не столь существенным показателем, как, скажем, десять лет назад. Поэтому при выборе инструмента для работы с архивами важнейшим критерием для большинства пользователей (во всяком случае тех, для кого обмен большими массивами данных — насущная проблема), вероятно, является способность программы «понимать» наиболее распространенные архивные форматы, даже если эти форматы не самые эффективные.

Программы архивации

Различными разработчиками были созданы специальные программы  для архивации файлов. Часть из них распространяется бесплатно, часть  — на коммерческой основе (за плату), но большинство программ такого рода распространяются как “Shareware”. т.е. они могут быть получены бесплатно, но если Вы хотите их использовать постоянно, то должны выслать авторам или  распространителям указанное (обычно небольшое, до 50 дол.) вознаграждение.

Как правило, программы  для архивации файлов позволяют  помещать копии файлов на диске в  сжатом виде в архивный файл, извлекать  файлы из архива, просматривать оглавление архива и т.д. Разные программы отличаются форматом архивных файлов, скоростью  работы, степенью сжатия файлов при  помещении в архив, удобством  использования.

Наиболее распространенные программы-архиваторы имеют приблизительно одинаковые возможности и ни одна из них не превосходит другие по всем параметрам: одни программы работают быстрее, другие обеспечивают лучшую степень  сжатия файлов. Даже если сравнивать программы  только по степени сжатия, то среди  них нет лидера: разные файлы лучше  сжимаются разными программами.

Принцип работы архиваторов  основан на поиске в файле "избыточной" информации и последующем ее кодировании  с целью получения минимального объема. Самым известным методом  архивации файлов является сжатие последовательностей  одинаковых символов. Например, внутри вашего файла находятся последовательности байтов, которые часто повторяются. Вместо того, чтобы хранить каждый байт, фиксируется количество повторяемых  символов и их позиция. Например, архивируемый файл занимает 15 байт и состоит из следующих символов:

B B B B B L L L L L A A A A A

В шестнадцатеричной  системе

42 42 42 42 42 4C 4C 4C 4C 4C 41 41 41 41 41

Архиватор может представить  этот файл в следующем виде 
(шестнадцатеричном):

01 05 42 06 05 4C 0A 05 41

Это значит: с первой позиции пять раз повторяется  символ "B", с позиции 6 пять раз  повторяется символ "L" и с  позиции 11 пять раз повторяется символ 
"A". Для хранения файла в такой форме потребуется всего 9 байт, что на 6 байт меньше исходного.

Описанный метод является простым и очень эффективным  способом сжатия файлов. Однако он не обеспечивает большой экономии объема, если обрабатываемый текст содержит небольшое количество последовательностей повторяющихся  символов. Более изощренный метод  сжатия данных, используемый в том  или ином виде практически любым  архиватором, - это так называемый оптимальный префиксный код и, в  частности, кодирование символами  переменной длины (алгоритм Хаффмана). Код переменной длины позволяет  записывать наиболее часто встречающиеся  символы и группы символов всего  лишь несколькими битами, в то время  как редкие символы и фразы  будут записаны более длинными битовыми строками. Например, в любом английском тексте буква 
E встречается чаще, чем Z, а X и Q относятся к наименее встречающимся. 
Таким образом, используя специальную таблицу соответствия, можно закодировать каждую букву Е меньшим числом бит и использовать более длинный код для более редких букв.

Популярные архиваторы ARJ, PAK, PKZIP работают на основе алгоритма 
Лемпела-Зива. Эти архиваторы классифицируются как адаптивные словарные кодировщики, в которых текстовые строки заменяются указателями на идентичные им строки, встречающиеся ранее в тексте. Например, все слова какой-нибудь книги могут быть представлены в виде номеров страниц и номеров строк некоторого словаря. Важнейшей отличительной чертой этого алгоритма является использование грамматического разбора предшествующего текста с расположением его на фразы, которые записываются в словарь. Указатели позволяют сделать ссылки на любую фразу в окне установленного размера, предшествующего текущей фразе. Если соответствие найдено, текущая фраза заменяется указателем на своего предыдущего двойника.

При архивации, как  и при компрессировании, степень  сжатия файлов сильно зависит от формата  файла. Графические файлы типа TIFF и GIF уже заранее компрессированы (хотя существует разновидность формата TIFF и без компрессии) и здесь  даже самый лучший архиватор мало чего найдет для упаковки. Совсем другая картина наблюдается при архивации  текстовых файлов, файлов *.ВМР и  им подобных.

Все программы для  архивации условно можно разделить  на две категории:

V Для командной  строки MS-DOS (ARJ, PKZIP, RAR и тд.)

V Для ос WINDOWS (WINZIP, WINRAR и тд.)

Архивный файл.

Архивный файл представляет собой набор из одного или нескольких файлов, помещенных в сжатом виде в  единый файл, из которого их можно при  необходимости извлечь в первоначальном виде. Архивный файл содержит оглавление, позволяющее узнать, какие файлы  содержаться в архиве. В оглавлении архива для каждого содержащегося  в нем файла храниться следующая  информация:

V имя файла;

V сведения о каталоге, в котором содержится файл;

V дата и время  последней модификации файла;

V размер файла на  диске и в архиве;

V код циклического  контроля для каждого файла,  используемый для проверки целостности  архива;

Определить с помощью  какой программы был заархивирован  тот или другой архивный файл, можно  при помощи расширения. Например:

V game.rar – заархивирован  при помощи архиватора RAR.

V game.arj – заархивирован  при помощи архиватора ARJ.

V game.zip - заархивирован  при помощи архиватора ZIP.

Невольно возникает  вопрос, зачем столько архиваторов  и все для одной лишь цели –  сжать объем файла. Разные программы  отличаются форматом архивных файлов, скоростью работы, степенью сжатия файлов при помещении в архив, удобством использования.

Архиваторы MS DOS.

С развитием компьютера стали увеличиваться и объемы информации хранимой в нем, что в  свою очередь привело к развитию технологий по хранению этой информации в сжатом виде, то есть в архивах. Для этого было придумано множество  программ осуществляющих архивацию  информации.

Однако в работе с этой информацией иногда нежелательно раскрывать полный архив, чтобы взять  один или два требуемых файла  или же просто посмотреть, что в  архиве за информация.

Программы-архиваторы, за исключением единиц, не предоставляют  удобных оболочек позволяющих просто, быстро и в наглядной форме  разобраться с содержимым архивов.

Наиболее известные  программы-архиваторы для MS-DOS: ARJ (разработчик - 
Robert K. Jung), PKZIP(компания PKWARE Inc.), IHA (Haruyasu Yoshizaki), ZOO 
(Rahul Dhesi). Безусловным лидером во всем мире за последние 5 лет стал архиватор RAR. В настоящее время RAR активно вытесняет ZIP как основную утилиту сжатия FTP архивов в сети INTERNET. RAR является единственной всемирно используемой программой, созданной русским программистом (за исключением TETRIS). Все архиваторы отличаются используемыми алгоритмами сжатия, форматами архивных файлов, скоростью работы и т.д.

PKZIP

Работает из командной  строки. Различные функции по обслуживанию архивов zip выполняются разными программами: pkzip - помещение файлов в архив pkunzip - извлечение файлов из архива zip2exe - создание самораспаковывающегося архива pkzipfix - восстановление поврежденного архива.

Изучить справку по работе с архиватором pkzip с помощью  команд: pkzip /h pkunzip /h zip2exe /h

ARJ

Работает из командной  строки. Выполняет все функции  по обслуживанию архивов .arj , в т.ч. поддержку  многотомных архивов.

Arj имеет очень большое  число ключей. Можно автоматизировать  много действий - создание резервной  копии диска, архивирование начиная  с какой-то даты, добавление к  имени архива текущей даты (arh970821.arj), архивирование файла с конкретного  места, несколько уровней сжатия  и так далее. В версии 
2.55 возможна работа с длинными именами.

Достоинства: очень  большое количество ключей, что дает возможность автоматизировать большое  число функций. Защита архива от повреждений.

Недостатки: отсутствие диалогового режима, некоторое неудобства работы при наличии какого-то ключа  в переменной окружения (ARJ_SW) и строке запуска - взаимное уничтожение.

RAR

1. Введение

Архиватор RAR был создан как достаточно универсальное средство сжатия файлов, содержащих самую различную  информацию, объединяющее достоинства  и удобства программ двух классов  архиватора командной строки и полноэкранной  оболочки для просмотра и других манипуляций с архивами.

В некоторых случаях  использование RAR не может быть заменено ни одним из существующих архиваторов, а логичный и простой интерфейс  делает его удобным средством  работы с архивами.

По своим техническим  характеристикам RAR не уступает широко распространенным и популярным архиваторам, а по некоторым показателям превосходит  их.

2. Технические характеристики

2.1. Степень сжатия

На файлах типа .EXE, .COM, .LIB, .OBJ, .OVR и аналогичных им RAR как правило обеспечивает максимальную по сравнению с другими архиваторами степень сжатия, превосходя их примерно на 0.5 - 3%

На отдельных файлах (больших .LIB, некоторых других) выигрыш  может достигать 5-7% от упакованного размера. Метод сжатия обычно существенно  не влияет на результат.

Текстовая информация сжимается примерно на уровне других архиваторов 
(зависит от вида текста и метода сжатия) на файлах до 32 килобайт размером. 
На больших текстовых файлах RAR обычно превосходит большинство других архиваторов.

При упаковке файлов баз данных существенно влиять на размер и время работы может метод  сжатия (m0 - m5).

Степень сжатия графической  информации сильно зависит от рода файлов.

При создании непрерывного (solid) архива, содержащего много небольших  однотипных файлов, степень сжатия на 10 - 40 % и более превосходит достигаемую  при упаковке в обычный архив.

2.2. Дополнительные  возможности

Помимо стандартных  функций RAR обеспечивает

Полноэкранный интерфейс:

V выбор упаковываемых  и распаковываемых файлов;

V эмуляция структуры  подкаталогов в архиве;

V работа с "мышью";

V сохранение параметров  в файле конфигурации;

V просмотр упакованных  и обычных файлов в текстовом  или 16-ричном виде.

Специальные функции:

V разбиение архива  на части (volumes) для переноса  на дискеты;

V создание и модифицирование  самораспаковывающихся архивов  (SFX);

V создание самораспаковывающихся  архивных томов (SFX);

V создание непрерывных  (solid) архивов с повышенной степенью  сжатия;

V защита информации  по паролям;

V защита архивов  от модификации;

V сохранение информации  об авторе архива;

V восстановление структуры  поврежденных архивов;

V добавление комментариев  ко всему архиву и к отдельным  файлам;

V встроенная поддержка  ANSI escape последовательностей в комментариях.

Работа с архивами ZIP, ARJ, LZH в полноэкранном режиме:

V выбор упаковываемых  и распаковываемых файлов

V эмуляция структуры  подкаталогов в архиве

V выполнение основных  операций над архивами

3.Работа с RAR из  командной строки

3.1. Формат вызова: rar - -

Команда может быть только одна, ключей - любое количество. Списочный файл может содержать  имена обрабатываемых файлов, разделенные  возвратом каретки или пробелом.

Файл с комментарием может содержать комментарий, добавляемый  к архиву при его создании, но не при модификации.

Путь распаковки применяется  вместе с командами 'e' и 'x', указывает  на подкаталог, в который будут  помещены распакованные файлы. Если этот подкаталог отсутствует, то он будет  создан.

3.2. Описание команд a: добавляет указанные файлы к  архиву m: переносит указанные файлы  и подкаталоги в архив.

При успешном завершении упаковки все указанные файлы  и подкаталоги удаляются с  диска.

Удаление подкаталогов будет выполнено только если не использовался  ключ 
-ed, а в качестве имени добавляемых файлов было указано *.* или имя подкаталога. mf: переносит указанные файлы в архив.

При успешном завершении упаковки все указанные файлы  удаляются с диска. d: удаляет указанные  файлы из архива

: извлекает указанные  файлы из архива с восстановлением  структуры подкаталогов (если при  архивировании был указан ключ -r). e: извлекает указанные файлы  из архива в текущий подкаталог v: просмотр содержимого архива.

Выдается полный путь доступа к файлу и его имя, файловый комментарий, неупакованный  и упакованный размер, степень  упаковки, дата и время последней  модификации файла, его атрибуты, контрольная сумма, метод сжатия и минимальная версия RAR, необходимая  для распаковки.

Если необходимо просмотреть  все архивные тома (volumes), то у имени  архива вместо расширения ставится *.

Например: RAR v myvolume.* l: просмотр содержимого архива.

Аналогично команде 'v', но вместо полного пути доступа  к файлу выдается только его имя. t: тестирует в архиве указанные  файлы u: добавляет к архиву те файлы, которых в нем нет, и обновляет  те, более поздние версии которые  есть на диске f: обновляет в архиве файлы, более поздние версии которых  есть на диске s: преобразует указанный  архив в самораспаковывающийся (SFX) типа EXE

Можно также преобразовать  в SFX первый из последовательности архивных томов, но при этом его исходный размер будет изменен, а это может  помешать выгрузке томов на дискеты, так что в этом случае лучше  использовать команду 
'a' с ключами -v[] -sfx

Пример: rar s myarchiv c: добавляет  комментарии к архиву

Для окончания ввода  нужно нажать F10. Esc отменяет ввод комментариев. Для удаления существующих комментариев нужно сразу же после вхождения  в режим ввода нажать F10.

Комментарии будут  выводиться при любых операциях  с архивом. Размер комментариев не может  превышать 16 килобайт.

Комментарии можно  ввести из файла, если перед именем файла поставить символ =

Пример: rar c myarchiv =info.txt

cf: добавляет комментарии  к отдельным файлам в архиве.

Для окончания ввода  нужно нажать F10. Esc отменяет ввод комментариев.

Для удаления существующих комментариев нужно сразу же после  вхождения в режим ввода нажать F10.

Комментарии будут  выводиться при просмотре архива командой 'v'. Размер комментариев не может  превышать 16 килобайт.

Пример: rar cf myarchiv *.txt cw: записывает архивный комментарий в  файл

Пример: rar cw myarchiv comment.txt

Комментарий из архива myarchive будет записан в файл comment.txt r: восстанавливает архив с поврежденной структурой

RAR не в состоянии  восстановить файлы с испорченной  информацией. Поэтому данная команда  не подходит для восстановления  файлов при распаковке которых  выдается сообщение CRC failed.

Но если в результате повреждения структуры архива стал невозможен доступ к нормальным файлам, либо при попытках работы с архивом  происходит 
"зависание" архиватора, то с помощью этой команды можно спасти оставшиеся данные.

При восстановлении архива создается файл $RECOVER.RAR в который  записывается вся сохранившаяся  информация. При обнаружении в  испорченном архиве подозрительных данных о которых архиватор не может вынести однозначного решения, выдается запрос пользователю:

Suspicious entry

Name:

Size: Packed:

Add it: Yes/No/All

При положительном  ответе данные добавляются к архиву $RECOVER.RAR

Пример: rar r myarchiv.rar

Команда a: может использоваться только для создания, но не обновления архивных томов и непрерывных  архивов.

Команды c: и cf: не работают с архивными томами, но работают с непрерывными архивами.

Комментарий к архивному  тому можно добавить непосредственно  при его создании, используя файл комментария.

3.3. Описание ключей

-? выводит экран  помощи

-r может использоваться  совместно с командами - a,u,f,m,x,e,t,p,v,l,c,cf,s.

При использовании  с командами a,u,f,m приводит к добавлению к архиву всех указанных файлов в  текущем и вложенных подкаталогах.

При использовании  с командами x,e,t,p,v,l,c,cf,s приводит к  обработке всех указанных архивов  в текущем и вложенных подкаталогах.

-o+ при распаковке  перезаписывать существующие файлы

-o- при распаковке  не перезаписывать существующие  файлы

-x все файлы, с  именами, соответствующими name, будут  исключены из обработки

Пример: RAR a -x*.bak arch

-sfx если этот ключ  указан при создании нового  архива, то будет создан 
SFX архив (последовательность ключей -v -sfx эквивалентна ключу 
-vs )

Пример: RAR a -sfx arch *.asm будет  создан SFX архив ARCH.EXE

-v или -v создание  архивных томов (volumes)

- размер тома в  тысячах байт (не килобайтах)

Если размер не указан, то он определяется автоматически.

Если тома создаются  на диске, где расположены временные  файлы (по умолчанию текущий, можно  изменить с помощью -w), то смена диска  невозможна. 
В этом случае автоматическое определение размера не имеет смысла и размер нужно указывать явно.

Если же тома создаются  не на диске с временными файлами, то после создания тома выводится  вопрос:

Create next volume: Yes/No/All/Quit

В это время можно  заменить диск. При ответе All дальнейшее создание томов происходит без запросов

Первый архивный том  имеет расширение .RAR, последующие  нумеруются от .R00 до .R99.

При распаковке и тестировании достаточно указать имя первого  тома. Если при распаковке не обнаружен  следующий том, то если тома находятся  не на диске с временными файлами  выдается запрос:

Insert disk with

После установки требуемого диска нужно нажать любую клавишу.

Если при распаковке не обнаружен следующий том и  тома находятся на диске с временными файлами, то программа завершается  аварийно с сообщением:

Can't find

Can't change disk with temporary files

Архивные тома не допускается  модифицировать. Команды 'd','f','u','s' для  них недопустимы, команда 'a' может  использоваться только для создания новых томов.

Размер файлов в  архивных томах может иногда несколько  превышать исходный, так как в  этом режиме не происходит простого запоминания  файла при неудачном сжатии.

-m: задание метода (степени сжатия) m0: запоминание без  сжатия m5: максимальное сжатие

По умолчанию используется метод -m3

-b: разрешить создание  резервных копий архива

В этом случае при  любых изменениях в архиве его  предыдущий вариант будет сохраняться  с расширением .BAK, либо, если у исходного  архива было расширение .BAK, у копии  будет расширение .$BK

-f: обновить файлы

Может использоваться при упаковке и распаковке.

-u: добавить изменившиеся  файлы

Может использоваться при упаковке и распаковке.

-ed: не добавлять  в архив пустые подкаталоги

При использовании  этого ключа в архив не будет  заноситься информация ни о каких  подкаталогах. Но информация о подкаталогах, файлы из которых добавляются  к архиву, уже содержится в полных именах этих файлов (путь доступа + имя). Поэтому при распаковке или в  полноэкранной оболочке такие подкаталоги  будут выглядеть как реально  существующие.

Если же в подкаталоге  не было файлов, добавляемых к архиву, то при использовании ключа -ed никакая  информация о нем не будет сохранена

-c- запретить вывод  комментариев

-e: исключить из  числа добавляемых файлов файлы  с атрибутами 
System, Hidden, Archive, Read only соответственно

Порядок следования атрибутов  не имеет значения.

Пример: rar a -ehs archive *.exe

К архиву не будут  добавлены файлы с атрибутами Hidden и System.

-s: создавать непрерывный  архив

Пример: rar a -s -vs362 archive *.*

Будут созданы непрерывные SFX тома размером 362000 байт каждый.

-av: добавляет к  архиву при любой его модификации  информацию об авторе и времени  модификации, имени архива

Если архив, созданный  с ключом -av, модифицируется без этого  ключа, то данная информация будет удалена.

При распаковке, тестировании, просмотре архивов, созданных с  ключом -av, выполняется контроль целостности  архива. При этом выдается сообщение: