ABBYY FineReader 11: её предназначение, функции и преимущества

СОДЕРЖАНИЕ

ГЛАВА 1 Вопросы к экзамену (1 семестр)……………………………………..

1.1Структурные единицы  информации………………………………………....

1.2Поколения электронной  вычислительной техники………………………....

1.3Виды прикладного программного  обеспечения…………………………….

1.4Виды и модели баз  данных…………………………………………………...

ГЛАВА 2 ABBYY FineReader 11,её предназначение, функции,реимущества

2.1Создание электронных  книг ………................................................................

2.2 Главное окно программы………………………………….……....................

2.3 Язык интерфейса ………………………….………………………………….

ГЛАВА3  Работа с ABBYY FineReader …………………………………...........

3.1. Встроенные задачи ABBYY FineReader………………………………........

3.2. Задачи конвертирования  в документ Microsoft Word …………………….

ГЛАВА4

4.1Задание 1……….……………………….……………………………….……..

4.2Задание2 ……………………………………………………………….………

4.3 Задание 3………………………………………………………………………

4.4 Задание 4…………………………………………………………………........

4.5 Задание 5……………………………………………………………………....

ЗАКЛЮЧЕНИЕ……………………………………………………………….......

БИБЛИОГРАФИЧЕСКИЙ СПИСОК……….......................................................

 

33

4

8

9

12

14

15

19

20

20

22

 

23

24

24

25

25

27

27


 

 

 

 

 

 

 

 

 

 

 

 

ГЛАВА 1

1.Структурные  единицы информации.

Структурные единицы информации определяют составные единицы информации, их логическую структуру и способы  перехода от одних единиц к другим. Структуризация данных (входных, выходных, условно-постоянных) необходима для их представления в памяти ЭВМ, размещения на машинных носителях, передачи информации и др. Объектом рассмотрения для пользователя является информация, отражающая ход выполнения цикла «заказ – изготовление – отгрузка – оплата», который возникает в ходе производственно-хозяйственной деятельности. Информация отражается в числовом виде через систему натуральных и стоимостных показателей. Автоматизация обработки информации в АИС требует ее структуризации и описания отдельных совокупностей.

Выделяют простые и  сложные информационные совокупности. Простые не поддаются дроблению, сложные образуются сочетанием различных элементов. Неделимая информационная совокупность называется реквизитом. Сложные элементы представляют собой сочетание предыдущих и называются составными элементами информации.

Выделяются следующие  информационные совокупности: реквизит, показатель, документ, массив, информационный поток, информационная подсистема, информационная система.

Минимальной информационной единицей являются реквизиты, отражающие отдельные свойства объекта. Они  состоят из сочетания цифр или  букв, имеющих смысловое содержание, и не поддаются дальнейшему делению.

Различают два вида реквизитов: реквизиты-признаки, показывающие качественные свойства отражаемых сущностей, и реквизиты-основания, характеризующие объект, процесс, явление  с количественной стороны.

В качестве реквизитов-признаков  выступают, например, наименование предприятия, его код, номер документа, номер  счета, дата. Над реквизитами-признаками выполняются только логические операции (например, сортировки).

К реквизитам-основаниям можно  отнести количество, сумму, расценки и различные производственные величины, над которыми выполняются арифметические операции.

2.Поколения электронной  вычислительной техники.

Так как ЭВМ представляет собой систему, состоящую из технических  и программных средств, то под  поколением естественно понимать модели ЭВМ, характеризуемые одинаковыми  технологическими и программными решениями (элементная база, логическая архитектура, программное обеспечение). Между  тем, в ряде случаев оказывается  весьма сложным провести классификацию  ВТ по поколениям, ибо грань между ними от поколения к поколению становиться все более размытой.

Первое поколение.     

Элементная база электронные  лампы и реле; оперативная память выполнялась на триггерах, позднее  на ферритовых сердечниках. Надежность - невысокая, требовалась система  охлаждения; ЭВМ имели значительные габариты. Быстродействие 5 - 30 тыс. арифметических оп/с; Программирование - в кодах  ЭВМ (машинный код), позднее появились  автокоды и ассемблеры. Программированием  занимался узкий круг математиков, физиков, инженеров - электронщиков. ЭВМ  первого поколения использовались в основном для научно-технических  расчетов.  

Второе поколение.    

Полупроводниковая элементная база. Значительно повышается надежность и производительность, снижаются  габариты и потребляемая мощность. Развитие средств ввода/вывода, внешней памяти. Ряд прогрессивных архитектурных решений и дальнейшее развитие технологии программирования режим разделения времени и режим мультипрограммирования (совмещение работы центрального процессора по обработке данных и каналов ввода/вывода, а также распараллеливания операций выборки команд и данных из памяти).    

В рамках второго поколения  четко стала проявляться дифференциация ЭВМ на малые, средние и большие. Существенно расширилась сфера  применения ЭВМ на решение задач - планово - экономических, управления производственными процессами и др.   Создаются автоматизированные системы управления (АСУ) предприятиями, целыми отраслями и технологическими процессами (АСУТП). Конец 50-х годов характеризуется появлением целого ряда проблемно-ориентированных языков программирования высокого уровня (ЯВУ): FORTRAN, ALGOL-60 и др. Развитие ПО получило в создании библиотек стандартных программ на различных языках программирования и различного назначения, мониторов и диспетчеров для управления режимами работы ЭВМ, планированием ее ресурсов, заложивших концепции операционных систем следующего поколения. 

Третье поколение.     

Элементная база на интегральных схемах (ИС). Появляются серии моделей  ЭВМ программно совместимых снизу  вверх и обладающих возрастающими  от модели к модели возможностями. Усложнилась  логическая архитектура ЭВМ и  их периферийное оборудование, что  существенно расширило функциональные и вычислительные возможности. Частью ЭВМ становятся операционные системы (ОС). Многие задачи управления памятью, устройствами ввода/вывода и другими  ресурсами стали брать на себя ОС или же непосредственно аппаратная часть ЭВМ. Мощным становиться программное  обеспечение: появляются системы управления базами данных (СУБД), системы автоматизирования  проектных работ (САПРы) различного назначения, совершенствуются АСУ, АСУТП. Большое внимание уделяется созданию пакетов прикладных программ (ППП) различного назначения.  

Развиваются языки и системы  программирования Примеры: серия моделей IBM/360, США, серийный выпуск -с 1964г; -ЕС ЭВМ, СССР и страны СЭВ с 1972г.  

 

 

 

Четвертое поколение.     

 Элементной базой становятся  большие (БИС) и сверхбольшие (СБИС) интегральные схемы. ЭВМ проектировались  уже на эффективное использование  программного обеспечения (например, UNIX-подобные ЭВМ, наилучшим образом  погружаемые в программную UNIX-среду; Prolog-машины, ориентированные на задачи  искусственного интеллекта); современных  ЯВУ. Получает мощное развитие  телекоммуникационная обработка  информации за счет повышения  качества каналов связи, использующих  спутниковую связь. Создаются  национальные и транснациональные  информационно-вычислительные сети, которые позволяют говорить о  начале компьютеризации человеческого  общества в целом.   

Дальнейшая интеллектуализация ВТ определяется созданием более развитых интерфейсов "человек-ЭВМ", баз знаний, экспертных систем, систем параллельного программирования и др.   Элементная база позволила достичь больших успехов в минитюаризации,  повышении надежности и производительности ЭВМ. Появились микро- и мини-ЭВМ, превосходящие по возможностям средние и большие ЭВМ предыдущего поколения при значительно меньшей стоимости. Технология производства процессоров на базе СБИС ускорила темпы выпуска ЭВМ и позволила внедрить компьютеры в широкие массы общества. С появление универсального процессора на одном кристалле (микропроцессор Intel-4004,1971г) началась эра ПК.    

Первым ПК можно считать Altair-8800, созданным на базе Intel-8080, в 1974г. Э.Робертсом. П.Аллен и У.Гейтс создали транслятор с популярного языка Basic, существенно увеличив интеллектуальность первого ПК (впоследствии основали знаменитую компанию Microsoft Inc). Лицо 4-го поколения в значительной мере определяется и созданием супер-ЭВМ, характеризующихся высокой производительностью (среднее быстродействие 50 - 130 мегафлопсов . 1 мегафлопс= 1млн. операций в секунду с плавающей точкой) и нетрадиционной архитектурой (принцип распараллеливания на основе конвейерной обработки команд). Супер-ЭВМ используются при решении задач математической физики, космологии и астрономии, моделировании сложных систем и др. Так как важную коммутирующую роль в сетях играют и будут играть мощные ЭВМ, то сетевая проблематика часто обсуждается совместно с вопросами по супер-ЭВМ Среди отечественных разработок супер-ЭВМ можно назвать машины серии Эльбрус, вычислительные системы пс-2000 и ПС-3000, содержащие до 64 процессоров, управляемых общим потоком команд, быстродействие на ряде задач достигалось порядка 200 мегафлопсов. Вместе с тем, учитывая сложность разработки и реализации проектов современных супер-ЭВМ, требующих интенсивных фундаментальных исследований в области вычислительных наук, электронных технологий, высокой культуры производства, серьезных финансовых затрат, представляется весьма маловероятным создание в обозримом будущем отечественных супер-ЭВМ, по основным характеристикам не уступающим лучшим зарубежным моделям.   

Следует заметить, при переходе на ИС-технологию производства ЭВМ определяющий акцент поколений все более смещается с элементной базы на другие показатели: логическая архитектура, программное обеспечение, интерфейс с пользователем, сферы приложения и т.д.    

Пятое поколение.     

Зарождается в недрах четвертого поколения и в значительной мере определяется результатами работы японского  Комитета научных исследований в  области ЭВМ, опубликованными в 1981г. Согласно этому проекту ЭВМ и  вычислительные системы пятого поколения  кроме высокой производительности и надежности при более низкой стоимости, вполне обеспечиваемые СБИС и др. новейшими технологиями, должны удовлетворять следующим качественно  новым функциональным требованиям:

  • обеспечить простоту применения ЭВМ путем реализации систем ввода/вывода информации голосом; диалоговой обработки информации с использованием естественных языков; возможности обучаемости, ассоциативных построений и логических выводов;
  • упростить процесс создания программных средств путем автоматизации синтеза программ по спецификациям исходных требований на естественных языках;
  • улучшить основные характеристики и эксплуатационные качества ВТ для удовлетворения различных социальных задач, улучшить соотношения затрат и результатов, быстродействия, легкости, компактности ЭВМ; обеспечить их разнообразие, высокую адаптируемость к приложениям и надежность в эксплуатации.

Учитывая сложность реализации поставленных перед пятым поколением задач, вполне возможно разбиение его  на более обозримые и лучше  ощущаемые этапы, первый из которых  во многом реализован в рамках настоящего четвертого поколения.

3.Виды прикладного  программного обеспечения.

Прикладные программы  предназначены для того, чтобы  обеспечить применение вычислительной техники в различных сферах деятельности человека. Помимо создания новых программных продуктов разработчики прикладных программ большие усилия тратят на совершенствование и модернизацию популярных систем, создание их новых версий. Новые версии, как правило, поддерживают старые, сохраняя преемственность, и включают в себя базовый минимум (стандарт) возможностей.

Один из возможных вариантов  классификации программных средств (ПС), составляющих прикладное программное  обеспечение (ППО), отражен на рис.1. Как и почти всякая классификация, приведенная на рисунке не является единственно возможной. В ней представлены даже не все виды прикладных программ. Тем не менее, использование классификации полезно для создания общего представления о ППО.

Рис.1.  Классификация прикладного  программного обеспечения.

4.Виды и модели  баз данных.

Дадим основное определение. База данных - это реализованная с помощью компьютера информационная структура (модель), отражающая состояние объектов и их отношения.

Следует учесть, что это  определение не является единственно  возможным. Информатика в отношении  определений чаще всего не похожа на математику с ее полной однозначностью. Если подойти к понятию «база  данных» с чисто пользовательской точки зрения, то возникает другое определение: база данных - совокупность хранимых операционных данных некоторого предприятия. Все дело в том, какой аспект доминирует в рассмотрении; в данной главе первое из определений более уместно.

Поскольку основу любой базы данных составляет информационная структура, базы данных делят на три рассмотренные  выше типа: табличные (реляционные), сетевые, иерархические.

Опыт использования баз  данных позволяет выделить общий  набор их рабочих характеристик:

• полнота - чем полнее база данных, тем вероятнее, что она  содержит нужную информацию (однако, не должно быть избыточной информации);

• правильная организация - чем лучше структурирована база данных, тем легче в ней найти  необходимые сведения;

• актуальность - любая база данных может быть точной и полной, если она постоянно обновляется, т.е. необходимо, чтобы база данных в каждый момент времени полностью соответствовала состоянию отображаемого ею объекта;

• удобство для использования - база данных должна быть проста и удобна в использовании и иметь развитые методы доступа к любой части информации.

Соответственно возможностям организации реляционных, иерархических  и сетевых информационых структур, существуют и аналогичные виды баз данных. В них данные представлены в формах, адекватных соответствующим структурам. Однако иерархические и сетевые базы данных являются гораздо менее распространенными, чем реляционные и не могут быть реализованы с помощью наиболее популярных СУБД, входящих в состав программного обеспечения ЭВМ, поэтому на них далее останавливаться не будем.

Реляционные базы данных.

Наиболее распространенными  в практике являются реляционные  базы данных. Название «реляционная» (в  переводе с английского relation - отношение) связано с тем, что каждая запись в таблице содержит информацию, относящуюся только к одному конкретному объекту.

Всякое отношение должно иметь свое имя. Пусть есть отношение  с названием «Альбомы группы». В  этом случае структура базы данных, состоящая из одной таблицы, запишется  так: Альбомы группы (название альбома, год выпуска, тип альбома, фирма). Однако чаще база данных строится на основе нескольких таблиц, связанных между собой через общие атрибуты. Пусть, например, в базе данных «Рок-энциклопедия» содержатся две таблицы – 1.а и 1.б

Таблица 1.а Музыкальные  альбомы групп

Код альбома

Код группы

Название альбома

Год выпуска

Тип альбома

Фирма

25

1

Help!

1965

Lp (English)

Pariophone

36

2

Led Zeppelin 4

l97l

Lp

Atlantic

35

2

Led Zeppelin 4 -

1970

Lp

Atlantic

34

3

Flash Gordon

1980

Soundtrack

EMI


 

 

Таблица 1.б Рок группы

Код группы

Название группы

Страна

Дата создания

Дата распада

1

The Bealles

Англия

1963

I970

2

3

Led Zeppelin 4

Flash Gordon

Англия 

Англия

1989

199I

-

-


Эти две таблицы связаны  между собой общим полем «Код группы». Поле «Код альбома» в таблице 1.а создается для того, чтобы  отличать альбомы друг от друга. Это  очень важно, так как в таблице могут находиться альбомы с одинаковыми названиями.

Необходимость использования  больше одной таблицы станет заметной, если объединить эти таблицы в  одну (табл.1. 2).

Таблица 1.2 Объединение таблиц 1.а и 1.б

Название группы

Страна

Дата создания

Дата распада

Название альбома

Год выпуска

Тип альбома

Фирма

               

The Beatles

Англия

1963

I970

With the Beatles

1963

Lp

Pariophone

The Beatles

Англия

1963

I970

Please, please me

1963

Lp

Pariophone

The Beatles

Англия

1963

I970

Rubber soul

1963

Lp

Pariophone


 

Из таблицы 1.2 видно, что при внесении в нее данных об альбомах определенной группы каждый раз приходится дублировать информацию первых четырех полей таблицы. Многократное сохранение в БД одних и тех же данных (название группы, страна, дата создания, дата распада) приведет к неэффективному использованию памяти, к тому же существенно возрастет вероятность ошибок при вводе данных. Разбив же данные по таблицам, можно в значительной степени избежать этих трудностей.

Через связь, определенную между  этими таблицами, можно узнать:

• сколько альбомов выпустила  группа;

• выпускались ли альбомы  у фирмы EMI;

• в каком году было выпущено максимальное количество альбомов и  т.п.

Реляционные базы данных удобны еще и тем, что для получения  ответов на различные запросы существует разработанный математический аппарат, который называется исчислением отношений или реляционной алгеброй. Ответы на запросы получаются путем «разрезания» и «склеивания» таблиц по строкам и столбцам. При этом ясно, что ответы также будут иметь форму таблиц.

ГЛАВА 2

ABBYY FineReader 11, её предназначение, функции, преимущества.

Программа Fine Reader производится отечественной компанией авве Software (www bitsoft.ru.). Эта программа предназначена для распознавания текстов на русском, английском, немецком, украинском, французском и многих других языках, а также для распознавания смешанных двух языковых текстов. Программа имеет ряд возможностей. Она позволяет объединить сканирования и распознавания в одну операцию, работать с пакетами документов и бланками. Программу можно научить для лучшего качества распознавания неправильно напечатанных текстов и сложных шрифтов. Она позволяет редактировать текст и проверять его орфографию. Fine Reader работает с различными моделями сканеров. Программа придерживается стандарта TWAIN. Мы рассмотрим программу на примере версии 11.

ABBYY FineReader 11. — это система оптического распознавания текстов (OCR — Optical Character Recognition). Она предназначена для конвертирования в редактируемые форматы отсканированных документов, PDF-документов и файлов изображений, включая цифровые фотографии.

Преимущества программы ABBYY FineReader- это скорость и высокая точность распознавания Используемая в ABBYY FineReader система оптического распознавания быстро и точно распознает и максимально полно сохраняет исходное оформление документа (в том числе с текстом на фоне картинок, с цветным текстом на цветном фоне, с обтеканием картинок текстом и т.д.). Благодаря технологии адаптивного распознавания документов ADRT® (Adaptive Document Recognition Technology) ABBYY FineReader позволяет анализировать и обрабатывать документ целиком, а не постранично. В результате восстанавливается исходная структура документа, включая форматирование, гиперссылки, адреса электронной почты, а также колонтитулы, подписи к картинкам и диаграммам, номера страниц и сноски.  ABBYY FineReader распознает документы, написанные на одном или нескольких из 189 языков, включая арабский, вьетнамский, корейский, китайский, японский, тайский и иврит. В программу встроена функция автоматического определения языка документа. Еще одной особенностью программы ABBYY FineReader является малая чувствительность к дефектам печати и способность распознавать тексты, набранные практически любыми шрифтами. Программа включает широкий спектр работы с результатами распознавания — документы можно сохранять в различных форматах, отправлять по электронной почте, а также передавать в другие приложения для дальнейшей обработки.

ABBYY FineReader имеет простой и интуитивно понятный интерфейс, который позволяет работать с программой без дополнительной подготовки, освоив основные операции в самые короткие сроки. Поддерживаемые программой языки интерфейса можно переключать непосредственно из программы. Встроенные задачи программы охватывают список наиболее часто используемых задач по конвертированию отсканированных документов, PDF и файлов изображений в редактируемые форматы и позволяют получить электронный документ одним нажатием кнопки. Благодаря интеграции ABBYY FineReader с Microsoft Office и Проводником 

Windows, вы можете распознать документ непосредственно при работе с Microsoft Outlook, Microsoft Word, Microsoft Excel и Проводником Windows.

Новые возможности ABBYY FineReader.

Если вам не нужно сохранять  цветовое оформление документов, вы можете распознавать документы на 30% быстрее  с помощью нового черно-белого режима. Кроме того, программа эффективно использует возможности многоядерных процессоров, что позволяет еще больше увеличить скорость обработки документов.

2.1 Создание электронных книг.

ABBYY FineReader 11 позволяет сканировать бумажные книги и конвертировать их в форматы EPUB и FB2, которые широко используются для создания электронных книг. Вы сможете читать их на вашем iPad, планшете или другом портативном устройстве. Или отправьте результаты распознавания на свой адрес на сервере Kindle.com. Конвертируйте бумажные книги и статьи в нужный формат электронной книги, чтобы добавить в свою электронную библиотеку или архив.

Новая версия программы распознает и конвертирует изображения документов и PDF-файлы в формат OpenOffice.org Writer (ODT), точно сохраняя исходное оформление и форматирование. Теперь вы без лишних усилий можете работать с документами в формате .odt или добавлять их в архив.

Усовершенствованный редактор стилей позволяет настраивать все  параметры стилей в одном удобном  диалоге. Все изменения происходят сразу во всем документе.

Вы можете рассортировать изображения страниц по нескольким документам FineReader для более точного сохранения оформления исходных документов.

Распознавать документы  стало еще проще с помощью  еще более легкого доступа  ко всем базовым и пользовательским задачам распознавания.

Улучшенное распознавание  фотографий и новые инструменты  для редактирования изображений

ABBYY FineReader 11 предлагает широкий диапазон новых мощных инструментов для редактирования изображений, включая настройку яркости, контрастности и уровней интенсивности света и тени, которая позволяет значительно улучшить исходное изображение и получить более точные результаты распознавания.

Увеличенная точность распознавания  и сохранения оформления с помощью улучшенного ADRT 2.0.Улучшено определение стилей документа, текста на полях страницы, колонтитулов и заголовков, что позволяет существенно уменьшить время, необходимое для редактирования распознанных документов.

Оптимальные режимы сохранения PDF-документов

Три новых режима сохранения PDF-документов - Наилучшее качество, Небольшой размер и Сбалансированный режим - помогут вам получить оптимальные результаты для разного типа задач.

Новые языки распознавания  - арабский, вьетнамский и туркменский. Программа ABBYY FineReader имеет простой и интуитивно понятный интерфейс, который позволяет работать с программой без дополнительной подготовки, освоив основные операции в самые короткие сроки.

ABBYY FineReader располагает возможностями для индивидуальной настройки интерфейса. Пользователь может настроить рабочее пространство по своему усмотрению:

• Изменить расположение и размер окон;

• Настроить панель быстрого доступа, предназначенную для доступа к наиболее часто используемым командам;

• Настроить горячие клавиши — можно как заменить предустановленные сочетания, так и добавить свои горячие клавиши для выполнения команд программы;

• Выбрать нужный язык интерфейса и др.

2.2 Главное окно программы

При запуске программы ABBYY FineReader открывается главное окно программы, а также окно Новая задача, предназначенное для выполнения встроенных и пользовательских задач. В главном окне программы отображается текущий открытый документ ABBYY FineReader.

В окне страницы отображаются страницы, входящие в документ FineReader. Возможны два режима отображения страниц: пиктограммы (см. рисунок) или таблица со столбцами сведений о страницах документа. Режим можно менять из контекстного меню данного окна, из меню  Вид, из диалога Опции (меню Сервис>Опции…).

•  В окне Изображение  показывается изображение текущей  страницы. Это окно позволяет редактировать  области на изображении, изображения  страниц, свойства текста.

•  В окне Текст отображается распознанный текст. В нем можно  проверять орфографию, форматировать  и редактировать текст, полученный в результате распознавания.

•  В окне Крупный план отображается увеличенное изображение  редактируемой строки или  обрабатываемого  участка изображения. Если в окне Изображение вы видите общий вид  страницы, то в окне Крупный план удобно просмотреть изображение  более детально, скорректировать  тип и положение областей или  сравнить неуверенно распознанный символ с его  увеличенным изображением. Масштаб изображения в окне «Крупный план» регулируется при помощи панели расположенной в нижней части этого окна. 

ABBYY FineReader 11: её предназначение, функции и преимущества