Текстовые редакторы и программы распознавания образов. 2

Содержание

Введение  3

Глава 1. Аппаратное и программное обеспечение  ввода текстовой и графической  информации  4

1.1 Назначение и классификация устройств ввода  4

1.2 Виды и характеристики сканеров  7

1.3 Виды текстовых редакторов 10

Глава 2. Текстовые редакторы и программы распознавания образов 13

2.1 Блокнот 13

2.2 Microsoft Word 15

2.3 Adobe Acrobat/Reader 19

2.4 FineReader 20

Выводы  и предложения 24

Список  использованной литературы 25 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

 

     

Введение

     Когда появились первые компьютеры, они разрабатывались с целью, чтобы ускорить математические и инженерные расчеты. Первые персональные машины решали довольно узкий спектр задач и в своей конструкции не имели интерактивных средств ввода/вывода. Любой обмен с человеком осуществлялся через громоздкие вспомогательные системы (перфокарты, перфоленты, магнитные ленты и т.д.). Естественно, чтобы ввести данные для расчетов или получить результат выполнения программы, требовалось много времени.

     Поэтому инженеры постоянно искали способы  улучшить скорость обмена информацией между компьютером и человеком. Со временем, вычислительная машина обзавелась монитором и клавиатурой, что позволило визуально получать результат работы программы и напрямую вводить команды в компьютер. Но манипулировать только цифрами (компьютер изначально способен “понимать” только цифровые двоичные данные) для человеческого восприятия очень неудобно, поэтому кому-то из инженеров пришла идея кодировать буквенные символы с помощью специальных “таблиц символов” (например ASCII). Это позволило вводить программу для компьютера в виде текста, где “написано”, что и как он должен вычислить, а также это позволило выводить результаты вычисления на монитор в виде удобочитаемого текста.

     Так, помимо собственно вычислений, компьютер  оказался способен воспринимать, хранить  и выводить текстовые данные. Со временем, компьютеры сильно усовершенствовались, список задач, которые они решают, сильно расширился. Вместе с ПК развивались и появлялись новые периферийные вспомогательные устройства для обмена информацией между ним и человеком (принтер, сканер, мышь и т.д.). Развивалось и программное обеспечение, которое взяло на себя львиную долю работы людей с документооборотом.

     Сейчас  сложно представить общество без  использования ПК в формировании его образа жизни. И до 90% вычислительных машин мира используются не для научных  или инженерных вычислений, а для  других целей, в том числе для  ввода, хранения, обработки и вывода текстовой информации.

     В этой работе я постараюсь провести обзор аппаратных средств, которые помогают “общаться” компьютеру и человеку, а также получить сведения и навыки по работе “программных инструментов” ПК по обработке текста.

     Для достижения поставленной перед собой  задачи, я изучу литературу по строению и работе наиболее массовых и востребованных периферийных устройств ввода, а так же литературу по описанию функциональных возможностей наиболее известных программных пакетов по работе с документами. Даже выполнение этой курсовой работы не обошлось без использования одной из этих программ, а именно Microsoft Word 2007, что лишний раз показывает, насколько важна эта тема для современного человека.

Глава 1. Аппаратное и программное  обеспечение ввода  текстовой и графической  информации

1.1 Назначение и классификация устройств ввода

     Компьютер обменивается с пользователем информацией  через устройства ввода/вывода. Без  них работа с вычислительной машиной  была бы практически невозможна или  сильно затруднена.

     Устройства  ввода преобразуют информацию в  форму понятную машине, после чего компьютер может ее обрабатывать и запоминать.

     Классификация устройств ввода:

 

 
 

 

 

 

 

 

     

       

       

Рис. 1 Классификация устройств  ввода

     Клавиатура (keyboard) − самое известное устройство ввода информации, это стандартное устройство, предназначенное для ручного ввода информации. Работой клавиатуры управляет контроллер клавиатуры, расположенный на материнской плате и подключаемый к ней через разъем на задней панели компьютера. При нажатии пользователем клавиши на клавиатуре, контроллер клавиатуры преобразует код нажатой клавиши в соответствующую последовательность битов и передает их компьютеру.

     Обычная современная клавиатура имеет, как  правило, 101-104 клавиши, среди которых  выделяют алфавитно-цифровые клавиши, необходимые для ввода текста, клавиши управления курсором, ряд специальных мультимедийных и управляющих клавиш. Существуют беспроводные модели клавиатуры, в них связь клавиатуры с компьютером осуществляется посредством инфракрасных лучей, либо посредством радиоволн.

     Наиболее  важными характеристиками клавиатуры являются чувствительность ее клавиш к нажатию, мягкость хода клавиш и  расстояние между клавишами. Долговечность клавиатуры определяется количеством нажатий, которые она рассчитана выдержать. Клавиатура проектируется таким образом, чтобы каждая клавиша выдерживала 30-50 миллионов нажатий.

     MIDI-клавиатура – это специализированный вид клавиатуры (упрощенной копией фортепианной) с привычными черными и белыми клавишами, который служит средством ввода команд для программного или аппаратного синтезатора: какую ноту, какой длительности, и на каком инструменте компьютеру следует воспроизвести.

     В отличие от привычных всем синтезаторов, MIDI-клавиатура сама не в состоянии  издать ни звука: она лишена всякой “начинки” для генерации звука, она клавиатуре не нужна, этим займется звуковая плата вашего компьютера.

     Сканер – устройство ввода графических изображений в компьютер. В сканер закладывается лист бумаги с изображением. Устройство считывает его и пересылает компьютеру в цифровом виде. Во время сканирования вдоль листа с изображением плавно перемещается мощная лампа и линейка с множеством расположенных на ней в ряд светочувствительных элементов. Обычно в качестве светочувствительных элементов используют фотодиоды. Каждый светочувствительный элемент вырабатывает сигнал, пропорциональный яркости отраженного света от участка бумаги, расположенного напротив него. Яркость отраженного луча меняется из-за того, что светлые места сканируемого изображения отражают гораздо лучше, чем темные, покрытые краской. В цветных сканерах расположено три группы светочувствительных элементов, обрабатывающих соответственно красные, зеленые и синие цвета. Таким образом, каждая точка изображения кодируется как сочетание сигналов, вырабатываемых светочувствительными элементами красной, зеленой и синей групп. Закодированный таким образом сигнал передается на контроллер сканера, затем в системный блок.

     Дигитайзер – это устройство для ввода графических данных, таких как чертежи, схемы, планы и т. п. Он состоит из планшета, соединенного с ним визира или специального карандаша. Перемещая карандаш по планшету, пользователь рисует изображение, которое выводится ПО компьютера на экран.

     К манипуляторам относят устройства, преобразующие движения руки пользователя в управляющую информацию для компьютера. Среди манипуляторов выделяют мыши, трекболы, джойстики. В настоящее время существуют манипуляторы, которые могут передавать в компьютер движения других частей тела человека (повороты/наклоны головы, движения ног, туловища и т.д.), но они пока слишком дороги для массового потребления и, как правило, используются в киноиндустрии для точного моделирования движений актеров при создании компьютерных спецэффектов.

       Мышь предназначена для выбора и перемещения графических объектов экрана монитора компьютера. Для этого используется указатель, перемещением которого по экрану управляет мышь. Мышь позволяет существенно сократить работу человека с клавиатурой при управлении курсором и вводе команд. Особенно эффективно мышь используется при работе графическими редакторами, издательскими системами, играми. Современные операционные системы также активно используют мышь для ввода управляющих команд.

     У мыши могут быть одна, две или  более клавиш. Между двумя крайними клавишами современных мышей часто располагают скролл. Это дополнительное устройство в виде колесика, которое позволяет осуществлять прокрутку документов вверх-вниз и другие дополнительные функции.

     Мышь  состоит из пластикового корпуса, сверху находятся кнопки, соединенные с  микропереключателями.

     Внутри  корпуса находятся датчики движения − приемники инфракрасных или лазерных лучей, отраженных от поверхности стола излучателем.

     Ранее в широком обращении существовали “шариковые мыши”, в корпусе которых был обрезиненный металлический шарик, нижней частью соприкасающегося с поверхностью стола или специального коврика для мыши. При движении манипулятора шарик вращается и переедает движение на соединенные с ним датчики продольного и поперечного перемещения. Датчики преобразуют движения шарика в соответствующие импульсы, которые передаются по проводам мыши в системный блок на управляющий контроллер. Контроллер передает обработанные сигналы операционной системе, которая перемещает графический указатель по экрану.

     В беспроводной мыши данные передаются с помощью радиоволн или инфракрасных лучей.

     Трекбол по функциям близок мыши, но шарик в нем больших размеров, и перемещение указателя осуществляется вращением этого шарика руками. Трекбол удобен тем, что его не требуется перемещать по поверхности стола, которого может не быть в наличии. Поэтому, по сравнению с мышью, он занимает на столе меньше места. Большинство ноутбуков ранее оснащались встроенным трекболом.

     Джойстик представляет собой игровой манипулятор, которые могут отличаться различным видом и функциональным назначением: руль, “геймпад”, джойстик для игр – авиа-симуляторов.

     Например, последний из них, имеет основание с подвижной рукояткой, которая может наклоняться в продольном и поперечном направлениях. Рукоятка и основание снабжаются кнопками. Внутри джойстика расположены датчики, преобразующие угол и направление наклона рукоятки в соответствующие сигналы, передаваемые операционной системе. В соответствии с этими сигналами осуществляется перемещение и управление графических объектов на экране.

1.2 Виды и характеристики сканеров

     Сканеры различаются по механизму считывания: ручные, протягивающие, планшетные и барабанные.

     В ручных сканерах пользователь сам ведет  сканер по поверхности изображения  или текста. Они медлительны, имеют низкие оптические разрешения (обычно 100 точек на дюйм) и часто сканируют изображения с перекосом. Но зато они недороги и компактны, в настоящее время практически вышли из обихода.

     Протягивающие сканеры предназначены для сканирования изображений на листах только определенного  формата. Протягивающее устройство таких сканеров с помощью направляющих роликов последовательно перемещает все участки сканируемого листа над неподвижной светочувствительной матрицей. Сканеры этого типа непригодны для ввода данных непосредственно из журналов или книг. Пример устройства, где используется точно такой же принцип – факсимильный аппарат, в котором лист бумаги при оцифровке протягивается через устройство и сканируется неподвижной матрицей.

     Наибольшее  распространение получили планшетные сканеры, которые позволяют сканировать  листы бумаги, книги и другие объекты, содержащие изображения. Такие сканеры состоят из пластикового корпуса, закрываемого крышкой. Верхняя поверхность корпуса выполняется из оптически прозрачного материала (стекла, пластика и т.д.), на который кладется сканируемое изображение. После этого изображение закрывается крышкой и производится сканирование. В процессе сканирования под стеклом перемещается лампа со светочувствительной матрицей (существуют планшетные сканеры, в которых перемещается стекло с оригиналом, а оптика и АПЦ остаются неподвижными, чем достигается более высокое качество сканирования).

     Оптическая  система планшетного сканера  (состоит из объектива и зеркал или призмы) проецирует световой поток  от сканируемого оригинала на приёмный элемент, осуществляющий разделение информации о цветах - три параллельных линейки  из равного числа отдельных светочувствительных  элементов, принимающие информацию о содержании красного, синего и  зеленого цветов. В трёхпроходных  сканерах используются лампы разных цветов или же меняющиеся светофильтры на лампе или CCD-матрице. Приёмный элемент  преобразует уровень освещенности в уровень напряжения. Далее, после  возможной коррекции и обработки, аналоговый сигнал поступает на аналого-цифровой преобразователь (АЦП). С АЦП информация выходит уже в двоичном виде и, после обработки в контроллере  сканера, через интерфейс с компьютером  поступает в драйвер сканера - обычно это так называемый TWAIN-модуль, с которым уже взаимодействуют  прикладные программы.

     Обычно  планшетный сканер считывает оригинал, освещая его снизу, с позиции  преобразователя. Чтобы сканировать  четкое изображение с пленки или  диапозитива, нужно обеспечивать подсветку  оригиналов как бы сзади. Для этого  и служит слайдовая приставка, представляющая собой лампу, которая перемещается синхронно со сканирующей кареткой и имеет определенную цветовую температуру.

     Барабанные  сканеры, по светочувствительности, значительно  превосходящие потребительские  планшетные устройства, применяются  исключительно в полиграфии, где  требуется высококачественное воспроизведение  профессиональных фотоснимков. Разрешение таких сканеров обычно составляет 8000-11000 точек на дюйм и более. В барабанных сканерах оригиналы размещаются  на внутренней или внешней (в зависимости  от модели) стороне прозрачного цилиндра, который называется барабаном. Чем  больше барабан, тем больше площадь  его поверхности, на которую монтируется  оригинал, и соответственно, тем  больше максимальная область сканирования. После монтажа оригинала барабан  приводится в движение. За один его  оборот считывается одна линия пикселей, так что процесс сканирования очень напоминает работу токарно-винторезного станка. Проходящий через слайд (или  отраженный от непрозрачного оригинала) узкий луч света, который создается  мощным лазером, с помощью системы  зеркал попадает на ФЭУ (фотоэлектронный  умножитель), где оцифровывается.

     Также сканеры классифицируются по типу светочувствительной  матрицы: черно-белая и цветная. Как нетрудно догадаться, в черно-белых моделях матрица сканера фиксирует только яркость отраженного света, что позволяет построить изображения с оттенками серого и черного цвета. В цветных сканерах в сканирующей матрице для каждого пикселя присутствуют три отдельных фотоэлемента, которые фиксируют яркость синего, красного и зеленого отраженного цвета, что позволяет построить полноценное цветное изображение.

     Основные характеристики сканеров − это скорость считывания, которая выражается количеством сканируемых станиц в минуту (ppm - pages per minute), разрешающая способность и глубина цвета.

     Разрешающая способность - измеряется в точках на дюйм (dots per inch, dpi). Характеристика, показывающая, чем больше разрешение, тем больше информации об оригинале может быть введено в компьютер и подвергнуто дальнейшей обработке. Часто приводится такая характеристика, как “интерполированное разрешение” (интерполяционное разрешение), это условное разрешение, до которого программа сканера “берется досчитать” недостающие точки. Этот параметр не имеет никакого отношения к механизму сканера и, если интерполяция нужна, то делать это лучше после сканирования с помощью хорошего графического пакета.

     Глубина цвета – это характеристика, обозначающая количество цветов, которое способен распознать сканер. Большинство компьютерных приложений, исключая профессиональные графические пакеты, такие как Photoshop, работают с 24 битным представлением цвета (полное количество цветов —16.77 млн. на точку). У сканеров эта характеристика, как правило, выше - 30 бит, и, у наиболее качественных из планшетных сканеров, - 36 бит и более. Конечно, может возникнуть вопрос - зачем сканеру распознать больше бит, чем он может передать в компьютер. Однако не все полученные биты равноценны. В сканерах с ПЗС датчиками два верхних бита теоретической глубины цвета обычно являются “шумовыми” и не несут точной информации о цвете. Наиболее очевидное следствие “шумовых” битов недостаточно непрерывные, гладкие переходы между смежными градациями яркости в оцифрованных изображениях. Соответственно в 36 битном сканере “шумовые” биты можно сдвинуть достаточно далеко, и в конечном оцифрованном изображении останется больше чистых тонов на канал цвета.

     По  типу интерфейса сканеры делятся  всего на четыре категории:

     1. Сканеры с параллельным или последовательным интерфейсом, подключаемые к LPT- или COM-порту. Эти интерфейсы самые медленные и сейчас сложно найти новое устройство с таким типом интерфейсного разъема.

     2. Сканеры с интерфейсом USB. Самый распространенный тип сканеров, работают значительно быстрее. Необходим компьютер с USB-портом.

     3. Сканеры со SCSI-интерфейсом. С собственной интерфейсной платой для шины ISA или PCI, либо подключаемые к стандартному SCSI-контроллеру. Эти сканеры быстрее и дороже представителей двух предыдущих категорий и относятся к более высокому классу.

     4. Сканеры с интерфейсом FireWire. Специально разработанным для работы с графикой и видео. Такие модели представлены на рынке относительно недавно и встречаются очень редко.

     На  качество изображения, получаемое в  результате сканирования, в большой  мере оказывает влияние источник света, используемый в конструкции  сканера. В современных планшетных сканерах используется четыре типа источников света:

     1. Ксеноновые газоразрядные лампы  отличаются чрезвычайно малым  временем прогрева, высокой стабильностью  излучения, небольшими размерами  и долгим сроком службы. С другой  стороны, они требуют высокого  напряжения, потребляют большой  ток и имеют неидеальный спектр, что пагубно сказывается на  точности цветопередачи. 

     2. Люминесцентные лампы с горячим  катодом обладают очень ровным, управляемым в определенных пределах  спектром и малым временем  прогрева. В качестве недостатков  можно назвать крупные габариты  и относительно короткий срок  службы.

     3. Люминесцентные лампы с холодным  катодом служат в десять раз  дольше предшественниц с горячим  катодом, имеют низкую рабочую  температуру и ровный спектр, однако время прогрева у них  велико — от 30 секунд до нескольких  минут. Именно такие лампы используются  в большинстве современных CCD-сканеров.

     4. Светодиоды (LED) применяются, как  правило, в CIS-сканерах, не требуют  времени для прогрева и обладают  небольшими габаритами и энергопотреблением. В большинстве случаев используются  трехцветные светодиоды, меняющие  с большой частотой спектр  излучаемого света. Светодиоды  имеют довольно низкую интенсивность  светового потока и неравномерный,  ограниченный спектр излучения,  поэтому у сканеров с таким  источником света страдает качество  цветопередачи, увеличивается уровень  шума на изображении и снижается  скорость сканирования.

1.3 Виды текстовых редакторов

     Каждый  пользователь компьютера сталкивался  с необходимостью редактирования той  или иной текстовой информации. Ранее, при работе на пишущих машинках возникало большое количество проблем по обработке текстовой информации, так как при наборе текста часто бывали опечатки, искажения. Если набирался важный документ, то требовалось дополнительное время для перепечатывания текста повторно.

     При использовании персонального компьютера для подготовки документов, текст редактируемого документа выводится на экран, и пользователь может вносить в него свои изменения до тех пор, пока его полностью не устроит внешний вид документа.

     Эффективность применения компьютеров для подготовки тестов привели к созданию множества  прикладных программ для обработки  документов. Такие программы называются текстовыми редакторами. Возможности этих программ различны – от программ, для подготовки небольших документов простейшей структуры, до программ для набора, оформления и полной подготовки к типографическому издательству.

     Текстовые редакторы подразделяются на несколько  видов, специфичных для различных  областей применения:

     1. редакторы документов – программы для обработки документов, ориентированные на работу с текстами, имеющие структуру документа, т. е. состоящими из разделов, страниц, абзацев, предложений и т.д. Следовательно, редакторы для обработки документов, в своем большинстве, обеспечивают функции, ориентированные на структуру документа, а именно:

     - возможность использования различных шрифтов символов;

     - задание произвольных межстрочных промежутков;

     - автоматический перенос слов на следующую строку;

     - автоматическую нумерацию страниц;

     - обработку и нумерацию строк;

     - печать верхних и нижних заголовков страниц (колонтитулов);

     - выравнивание краев абзаца;

     - набор текста в несколько столбцов;

     - создание таблиц и построение диаграмм;

     - проверку правописания и подбор символов.

     Существует  огромное количество редакторов текста – от простых до сложных. Среди наиболее распространенных в мире редакторов выделяется Microsoft Word, Word Perfect, Open Office. Среди простых редакторов текста наиболее известен “Блокнот”, входящий в состав ОС Windows.

     2. издательские системы – используются для подготовки рекламных буклетов, оформления журналов и книг. Они позволяют создавать сложные документы высочайшего качества.

     Имеются два основных вида издательских систем. Издательские системы первого вида удобны для подготовки небольших  материалов с иллюстрациями, графиками  диаграммами, различными шрифтами в  тексте. Их используют для подготовки газет, рекламных буклетов и небольших  журналов. Примером такой системы  является Aldus PageMaker.

     Издательские  системы второго вида более подходят для подготовки больших документов, например книг. Они обладают теми же возможностями, что и системы  первого направления, но для них  характерно наличие развитого аппарата параметров размещения текста. Это  позволяет легко изменять оформление документа, сохраняя единство стиля, а  также автоматизировать процесс  верстки. Одним из распространенных систем второго вида является система  Venture Publisher. Это универсальная система, может считывать тексты, подготовленные в Microsoft Word, сохраняя при этом некоторые параметры форматирования, установленные этим редактором.

     Основная  операция для чего используются издательские системы – это верстка, т.е. размещение текста по страницам документа, вставка  рисунков, оформление текста разными  шрифтами и т.д. А в режиме ввода и редактирования текста Ventura Publisher и Aldus PageMaker, значительно уступают такому редактору текстов как Microsoft Word.

     В последнее время некоторые текстовые редакторы документов, очень сильно приблизились по своим функциональным возможностям, к издательским системам.

     3. редакторы текстов программ рассчитаны на редактирование программ на том или ином языке программирования. Часто они встроены в систему программирования на некотором языке программирования и имеют функцию подсветки синтаксиса, которая подсвечивает команды и спецсимволы языка программирования, что сильно помогает при визуальном просмотре листинга программы. Примером служат редакторы, встроенные в систему программирования Visual C++, Turbo Pascal, Delphi, Basic и т.д.

     Данные  типы редакторов выполняют следующие функции:

     - диалоговый просмотр текста;

     - редактирование строк программы;

     - копирование и перенос блоков текста из одного места в другое;

     - копирование одной программы или её части в указанное место другой программы;

     - контекстный поиск и замену подстрок текста;

     - автоматический поиск строки, содержащей ошибку;

     - распечатку программы или её необходимой её части.

     Редакторы текстов программ позволяют автоматически  проверять синтаксическую правильность программ.

     4. редакторы научных документов – это редакторы для специальных категорий пользователей, специалистов, научных работников, конструкторов, которым необходимо подготавливать документы со сложными математическими, химическими формулами, специальными символами, матрицами, сложными диаграммами. Поэтому для подготовки таких документов были созданы специальные редакторы научных документов.

     Представителями таких редакторов является ChiWriter, MathOr, MathWord, TEX.

     Использование редакторов текста общего назначения для подготовки текстов с формулами  имеет смысл, только если документ содержит относительно немного формул. Для  документов с интенсивным использованием формул, гораздо эффективнее будет специализированная система.